지도 미세 조정
사람이 작성한 정답 데이터를 모델에 학습시켜 특정 작업 수행 능력을 높이는 기법이다. 모델의 말투나 답변 스타일을 결정하는 핵심 단계로, 최근 모델의 답변 톤 변화의 원인으로 지목된다.