고속 행동 토큰화
로봇의 연속적인 행동 데이터를 이산적인 토큰 형태로 변환하는 기법이다. 이산 코사인 변환(DCT)과 바이트 쌍 인코딩(BPE)을 사용하여 고차원의 행동 시퀀스를 압축함으로써 MLLM이 언어처럼 행동을 처리할 수 있게 한다.