멀티모달 학습
텍스트, 이미지, 오디오 등 서로 다른 형태의 데이터를 함께 학습하여 정보를 통합적으로 이해하는 기술이다. 인간이 오감을 사용하는 것과 유사하게 다양한 정보를 결합함으로써 더 정교한 추론과 인식이 가능해진다.