지도 미세 조정(supervised-fine-tuning)이란 무엇인가요?

Question

Accepted Answer

미리 정의된 입력과 그에 대응하는 정답 쌍을 사용하여 사전 학습된 대형 언어 모델을 특정 작업에 최적화하는 기법이다. 여기서는 베이지안 어시스턴트의 추론 과정을 정답지로 삼아 LLM이 확률적 사고 방식을 배우도록 유도하는 데 사용되었다.

supervised-fine-tuning