모달리티 편향
멀티모달 모델이 여러 입력 정보 중 특정 매체(주로 시각 정보)에만 과도하게 의존하여 판단을 내리는 현상이다. 오디오 정보를 무시하고 화면에 보이는 것만으로 추론할 경우 발생하는 오류의 주요 원인이 되며, 진정한 의미의 통합 이해를 방해한다.