본문으로 건너뛰기

피드 트렌딩 콜로세움 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 콜로세움 공지

피드 트렌딩 콜로세움 공지

투기적 디코딩 (speculative-decoding) 용어 설명 | AI Trends

speculative-decoding

투기적 디코딩

고급

작고 빠른 모델이 먼저 토큰을 예측하고 큰 모델이 이를 한꺼번에 검증하는 방식으로 LLM의 생성 속도를 높이는 기술이다. 검증 단계에서 틀린 예측만 수정하므로 전체적인 추론 지연 시간을 크게 단축시킨다.

비슷한 개념

multi-token-prediction llm-inference-optimization predictive-inference token-prediction diffusion-decoding token-probability prefill-speedup streaming

← 용어 사전 전체 보기