답변 분리도
모델이 생성한 여러 후보 답변 중 최상위 후보가 나머지 경쟁 후보들과 얼마나 명확하게 구별되는지를 측정하는 신뢰도 지표이다. 정답 라벨 없이 로짓 분포의 통계적 특성만으로 소형 모델의 답변을 채택할지 에이전트로 넘길지를 결정하는 기준이 된다.