데이터 정제
수집된 원시 데이터에서 오류, 중복, 결측치를 제거하거나 수정하여 분석 가능한 상태로 만드는 과정이다. 실무 ML 프로젝트에서 가장 많은 시간이 소요되며 모델의 성능을 결정짓는 핵심적인 단계이다.