모션 정렬
비디오의 움직임 정보를 모델 내부의 표현과 일치시키는 과정이다. 큐브 인페인팅이나 속도 변조 같은 복원 작업을 통해 외부 데이터 없이도 비디오 고유의 물리적 동역학을 학습하도록 유도한다.