바늘 찾기
방대한 텍스트 데이터(건초더미) 속에 숨겨진 특정 정보(바늘)를 모델이 얼마나 정확하게 찾아내는지 평가하는 벤치마크다. 모델의 장기 기억력과 문맥 이해 능력을 측정하는 핵심 지표로 활용된다.