데이터 프루닝
학습 데이터셋에서 품질이 낮거나 중복되는 데이터를 제거하여 모델의 성능을 높이는 과정이다. 노이즈를 줄여 모델이 핵심적인 특징을 더 잘 학습하게 돕는 중요한 전처리 단계이다.