인과적 토큰화
데이터 시퀀스에서 특정 시점의 토큰이 오직 이전 시점의 토큰들에만 의존하도록 구성하는 방식입니다. 자기회귀 모델이 다음 요소를 예측하는 학습 구조를 갖추는 데 필수적인 메커니즘입니다.