비전 파운데이션 모델
방대한 데이터로 사전 학습되어 다양한 시각 작업에 범용적으로 사용 가능한 대규모 모델이다. DINOv2나 CLIP이 대표적이며, 강력한 특징 추출 능력을 갖추고 있어 하위 작업으로의 전이가 용이하다.