마르코프 결정 과정
의사결정 문제를 수학적으로 모델링한 프레임워크로, 상태, 행동, 전이 확률, 보상으로 구성된다. 비디오 에이전트가 현재까지 본 정보(상태)를 바탕으로 다음 프레임을 선택(행동)하는 과정을 정의하는 기초가 된다.