양자화된 저랭크 적응
모델을 4비트로 양자화하여 메모리 사용량을 대폭 줄이면서도 효율적으로 파인튜닝하는 기법이다. 적은 VRAM으로도 거대 모델을 학습시킬 수 있어 로컬 환경에서 필수적인 기술이다.