멀티모달
텍스트, 이미지, 오디오, 비디오 등 서로 다른 형태의 데이터를 동시에 처리하고 이해하는 AI 기술이다. 인간이 오감을 통해 세상을 인지하듯 AI가 다양한 정보를 통합 학습함으로써 더 정교한 추론과 생성이 가능해진다. 최근 GPT-4o나 Gemini 등 최신 모델들의 핵심 트렌드이다.