본문으로 건너뛰기

피드 트렌딩 콜로세움 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 콜로세움 공지

피드 트렌딩 콜로세움 공지

GPTQ 양자화 (gptq) 용어 설명 | AI Trends

gptq

GPTQ 양자화

중급

모델의 가중치를 4비트 등으로 압축하여 메모리 사용량을 줄이고 추론 속도를 높이는 포스트 트레이닝 양자화 기법이다. 대규모 언어 모델을 일반 소비자용 GPU에서 실행 가능하게 만드는 핵심 기술이다.

비슷한 개념

quantization qlora post-training-quantization ptq llm-inference-optimization dynamic-quantization fp8-quantization token-optimization

← 용어 사전 전체 보기