상세 이미지 캡셔닝
이미지의 전체적인 맥락뿐만 아니라 내부의 다양한 객체와 그들 간의 관계를 매우 상세하게 설명하는 기술입니다. 시각적 정보를 텍스트로 정밀하게 변환하여 멀티모달 모델의 학습 데이터로 활용됩니다.