시각 언어 행동 모델
Vision-Language-Action의 약자로, 시각 정보와 언어 명령을 결합하여 로봇의 구체적인 물리적 행동을 제어하는 인공지능 모델 기법이다. 로봇이 주변 환경을 이해하고 지시에 따라 적절한 동작을 수행하게 하는 핵심 기술이다.