입력 처리 시간
모델이 입력된 텍스트(프롬프트)를 이해하고 연산을 준비하는 단계에서 소요되는 시간이다. 긴 문맥을 처리할 때 이 시간이 길어질 수 있으며, 효율적인 아키텍처일수록 이 단계의 지연 시간이 짧다.