분포 외 성능 저하
모델이 학습 데이터와 성격이 다른 새로운 데이터를 만났을 때 성능이 급격히 떨어지는 현상이다. 에이전트 학습에서는 특정 정답 궤적만 암기할 때 발생하며, 모델의 범용적인 추론 능력을 손상시킨다.