모드 붕괴
생성 모델이 다양한 데이터를 생성하지 못하고 특정 몇 가지 패턴(모드)에만 집중하여 출력을 내놓는 현상을 의미한다. RLHF 과정에서 모델이 인간 평가자가 선호하는 특정 답변 유형으로만 수렴하는 현상을 설명하는 데 쓰인다.