가치 정렬
AI 모델이 인간의 가치, 윤리, 선호도와 일치하도록 학습시키는 과정이다. 모델이 유해한 답변을 피하고 유용한 정보를 제공하게 만드는 핵심 기술이다. 본 연구에서는 이 정렬이 사후 학습의 어느 단계에서 발생하는지를 중점적으로 조사하며 SFT의 중요성을 입증했다.