다지선다형 질의응답
모델에게 여러 개의 선택지를 주고 그중 정답을 고르게 하는 평가 방식이다. 구조화된 상호작용을 통해 모델의 판단 능력을 정량적으로 측정하기 용이하며, 본 논문에서는 능동적 제안과 정답 카테고리를 선택지에 포함하여 평가한다.