역 KL 발산
두 확률 분포의 차이를 계산할 때 학생 모델의 분포를 기준으로 삼아, 모델이 정답 후보 중 가장 확실한 모드(Mode)에 집중하도록 유도하는 손실 함수이다. 이는 모델이 모호한 답변 대신 결정론적이고 정확한 답변을 내놓게 하는 데 효과적이다.