본문으로 건너뛰기
AI Trends
피드
트렌딩
콜로세움
공지
로그인
피드
트렌딩
콜로세움
공지
대리 보상 학습 (surrogate-reward-learning) 용어 설명 | AI Trends
surrogate-reward-learning
대리 보상 학습
고급
직접 최적화하기 어려운 복잡하거나 미분 불가능한 보상 함수를 대신하여, 이를 근사하고 미분 가능하게 만든 별도의 모델을 학습시키는 기법입니다.
비슷한 개념
surrogate-model
behavioral-cloning
imitation-learning
reinforcement-learning
deep-reinforcement-learning
reward-modeling
behavior-cloning
long-horizon-rl
← 용어 사전 전체 보기