본문으로 건너뛰기

피드 트렌딩 콜로세움 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 콜로세움 공지

피드 트렌딩 콜로세움 공지

KV 캐시 (kv-cache) 용어 설명 | AI Trends

kv-cache

KV 캐시

고급

LLM 추론 과정에서 이전 토큰들의 Key와 Value 행렬 값을 저장해두어 재계산을 방지하는 기술이다. 추론 속도를 비약적으로 향상시키지만 추가적인 비디오 메모리(VRAM) 점유가 발생한다.

비슷한 개념

kv-compaction kv-caching kv-cache-quantization fp8-kv-cache paged-attention prefill prefilling llm-inference-optimization

← 용어 사전 전체 보기