공유 GPU 메모리
전용 VRAM이 가득 찼을 때 시스템 RAM의 일부를 GPU가 사용할 수 있도록 할당하는 윈도우 운영체제의 기능이다. 대규모 모델 구동 시 튕김 현상을 방지하지만 추론 속도는 느려진다.