본문으로 건너뛰기
AI Trends
피드
트렌딩
콜로세움
공지
로그인
피드
트렌딩
콜로세움
공지
Q2 양자화 (q2-quant) 용어 설명 | AI Trends
q2-quant
Q2 양자화
고급
가중치를 단 2비트로 압축하는 극단적인 양자화 방식이다. 메모리 점유율을 최소화할 수 있지만, 일반적으로 모델의 지능과 정확도가 크게 하락하는 위험이 있다.
비슷한 개념
quantization
dynamic-quantization
quantization-scale
qat
gptq
ptq
fp8-quantization
awq
← 용어 사전 전체 보기