지연 시간
사용자의 요청부터 시스템의 응답이 완료될 때까지 걸리는 시간이다. LLM 애플리케이션에서는 모델의 추론 시간과 도구 실행 시간이 주요 원인이다. 사용자 경험 최적화를 위해 반드시 고려해야 할 요소다.