핫팟QA
여러 문서에 흩어진 정보를 조합해야만 풀 수 있는 질문들로 구성된 대표적인 질의응답 벤치마크이다. AI 모델의 다단계 추론 능력과 정보 검색 정확도를 객관적으로 평가하는 지표로 널리 활용된다.