지도 미세 조정
미리 정의된 입력과 그에 대응하는 정답 쌍을 사용하여 사전 학습된 대형 언어 모델을 특정 작업에 최적화하는 기법이다. 여기서는 베이지안 어시스턴트의 추론 과정을 정답지로 삼아 LLM이 확률적 사고 방식을 배우도록 유도하는 데 사용되었다.