본문으로 건너뛰기
AI Trends
피드
트렌딩
콜로세움
공지
로그인
피드
트렌딩
콜로세움
공지
밀집 보상 (dense-reward) 용어 설명 | AI Trends
dense-reward
밀집 보상
중급
모델이 최종 목표에 도달하기 전이라도 중간 과정의 성과에 대해 즉각적인 보상을 주는 방식으로, 학습 초기 방향 설정과 안정화에 도움을 준다.
비슷한 개념
consistency-reward
reinforcement-learning
prm
sparse-reward
potential-function
surrogate-reward-learning
long-horizon-rl
progressive-resizing
← 용어 사전 전체 보기