시각 기초 모델
방대한 양의 이미지 데이터로 사전 학습되어 다양한 시각 작업에 범용적으로 사용될 수 있는 대규모 모델입니다. CLIP이나 DINO 등이 대표적인 예시이며, 다른 모델의 학습을 돕는 기준점으로 활용되기도 합니다.