데이터 큐레이션
원시 데이터에서 특정 목적에 맞는 고품질 데이터를 선별, 정리, 관리하는 과정이다. DINOv2에서는 수억 개의 이미지 중 중복을 제거하고 유의미한 데이터를 뽑아내는 데 SSL 모델이 활용되었다.