추론 시 연산량
모델이 답변을 생성하는 시점에 할당되는 계산 자원을 의미합니다. 최근 추론 모델들은 더 긴 사고 과정을 거치거나 여러 번의 시도를 통해 정답률을 높이기 위해 추론 시 더 많은 연산을 수행하는 경향이 있습니다.