벤치맥싱
AI 모델이 실제 성능보다 벤치마크 점수에서만 높게 나오도록 특정 데이터셋에 과적합시키거나 최적화하는 행위이다. 이는 모델의 범용적인 지능보다는 지표상의 수치를 높이는 데 집중하여 실제 사용 시 성능 저하를 초래할 수 있다.