비디오 램
그래픽 카드(GPU)에 장착된 전용 메모리로 LLM 모델의 파라미터와 연산 데이터를 로드하는 공간이다. 로컬 LLM 구동 시 모델의 크기와 양자화 수준을 결정하는 가장 핵심적인 하드웨어 자원이다.