데이터 인제스션
다양한 소스로부터 데이터를 수집하고 학습 가능한 형태로 가공하여 시스템에 입력하는 과정이다. LLM 학습의 첫 단계로, 효율적인 파이프라인 구축이 모델 성능에 큰 영향을 미친다.