CLIP 비전
이미지를 텍스트와 정렬된 벡터 공간으로 인코딩하여 AI 모델이 이미지의 시각적 내용을 이해하도록 돕는 모델이다. 애니메이션 워크플로우에서 참조 이미지의 스타일이나 구도를 유지하는 데 핵심적인 역할을 한다.