인식-추론 역전
하위 단계인 기호 인식 성능보다 상위 단계인 논리 추론 성능이 더 높게 나타나는 역설적인 현상이다. 모델이 시각적 인식을 건너뛰고 언어적 지식만으로 문제를 해결하고 있음을 시사하며 진정한 시각적 이해의 부재를 드러낸다.