경로 예측
에이전트가 현재 행동을 결정하기 전에 향후 발생할 여러 단계의 상태 변화와 행동 시퀀스를 미리 시뮬레이션하는 기법이다. 이를 통해 당장의 이득보다 장기적인 목표 달성에 유리한 결정을 내릴 수 있으며 복잡한 다단계 작업의 성공률을 높인다.