에너지 기반 모델
데이터의 각 상태에 '에너지'라는 점수를 부여하여 낮은 에너지를 가진 상태를 선호하도록 학습하는 모델이다. 이 아티클에서는 유효하지 않은 행동에 높은 에너지를 부여해 수학적으로 실행을 차단하는 검증 도구로 제안되었다.