지시어 튜닝
모델이 사용자의 구체적인 명령이나 질문에 적절히 응답하도록 '명령-응답' 쌍의 데이터를 학습시키는 과정이다. 단순 텍스트 생성을 넘어 특정 작업 수행 능력을 극대화하는 데 필수적인 단계이다.