시공간적 근거 찾기
비디오 내에서 특정 사건이나 객체가 '언제(시간)' 그리고 '어디에(공간)' 나타나는지 정확히 식별하고 추적하는 기술이다. 비디오 추론 모델이 단순히 텍스트 답안을 생성하는 것을 넘어, 실제 시각적 증거에 기반하고 있는지 확인하는 핵심 지표로 활용된다.