잔차 가치 예측기
현재 상태의 절대적인 가치 대신 이전 상태와 비교하여 얼마나 진전이 있었는지를 측정하는 방식입니다. LLM이 자신의 답변을 과도하게 긍정적으로 평가하는 편향을 줄이는 데 효과적입니다.