시각적 어텐션 점수
트랜스포머 모델의 어텐션 메커니즘에서 시각적 토큰들이 받는 어텐션 가중치의 총합을 의미한다. 모델이 복잡한 추론을 수행할 때 입력된 이미지 정보를 얼마나 적극적으로 참조하고 활용하는지 보여주는 핵심적인 정량적 지표로 활용된다.