이산 확산
데이터를 연속적인 수치가 아닌 이산적인 토큰(범주형 데이터)으로 취급하여 생성하는 모델링 방식이다. 주로 마스킹된 토큰을 주변 문맥을 통해 복원하는 과정을 반복하며, 언어 모델과 동일한 토큰 예측 패러다임을 공유하여 멀티모달 통합에 유리하다.