엔드투엔드 응답 시간
사용자가 프롬프트를 입력한 시점부터 최종 결과물을 모두 수신할 때까지 걸리는 전체 시간을 의미한다. 입력 처리, 모델의 추론(Thinking), 토큰 생성 시간이 모두 포함되며 사용자 경험을 결정하는 핵심 지표이다.