데이터 누수
모델 학습 과정에서 타겟 변수의 정보가 의도치 않게 입력 변수에 포함되어 성능이 비정상적으로 높게 측정되는 현상이다. 예측 시점에는 알 수 없는 정보를 학습에 사용함으로써 실제 환경에서의 성능 저하를 초래한다.