벡터 양자화 토크나이저
이미지의 연속적인 픽셀 데이터를 코드북에 정의된 유한한 개수의 이산적인 토큰으로 변환하는 장치이다. 이미지를 압축하여 언어 모델처럼 처리할 수 있게 해주며, 코드북 크기가 클수록 이미지 복원력이 좋아지지만 학습 난이도가 상승한다.