데이터 검증
입력 데이터가 사전에 정의된 규칙이나 스키마를 준수하는지 확인하여 데이터 품질을 보장하는 과정이다. Pandera와 같은 도구를 사용하여 데이터 오류를 조기에 발견함으로써 전체 ML 파이프라인의 신뢰성을 높인다.