조기 종료
모델이 모든 계산 단계를 다 거치지 않고, 충분히 정답을 확신할 수 있는 시점에 추론을 멈추는 기술이다. 쉬운 문제는 빠르게 답하고 어려운 문제에만 더 많은 연산 자원을 할당하여 전체적인 추론 효율성을 극대화한다.