벡터 양자화 변분 오토인코더
연속적인 잠재 공간의 벡터를 가장 가까운 코드북 인덱스로 변환하여 데이터를 이산적인 토큰으로 압축하는 신경망 구조이다. 동작 생성에서는 복잡한 움직임을 유한한 개수의 단어처럼 표현하여 언어 모델과 같은 구조로 처리할 수 있게 한다.