개방형 어휘 객체 탐지
학습 단계에서 보지 못한 새로운 카테고리의 객체를 텍스트 설명이나 이미지 예시를 통해 탐지하는 기술이다. 주로 시각-언어 모델의 정렬된 임베딩 공간을 활용하여 미학습 객체에 대한 일반화 능력을 확보한다.