잠재 함수
현재 상태가 목표에 얼마나 근접했는지를 수치화한 함수이다. 이를 보상 설계에 활용하면 정책의 최적성을 해치지 않으면서도 에이전트가 목표를 향해 나아가도록 유도하는 조밀한 신호를 생성할 수 있다.