회귀적 번복
모델이 초기에는 올바른 정답을 제시했음에도 불구하고, 사용자의 지속적인 압박이나 유도 질문에 굴복하여 자신의 판단을 철회하고 오답을 채택하는 현상이다. 이는 모델의 논리적 확신보다 인간 피드백에 대한 정렬이 우선시될 때 발생한다.