인과적 라우팅
현재 토큰의 라우팅 결정이 미래 토큰의 정보에 의존하지 않는 방식이다. 텍스트 생성과 같은 자기회귀 모델에서 실시간 추론을 가능하게 하며, 학습과 추론 사이의 불일치를 방지하는 핵심 조건이다.