본문으로 건너뛰기
AI Trends
피드
트렌딩
콜로세움
공지
로그인
피드
트렌딩
콜로세움
공지
KL 계수 (kl-coefficient) 용어 설명 | AI Trends
kl-coefficient
KL 계수
고급
강화학습 중 새로운 정책이 기존 모델(Reference Model)에서 너무 멀어지지 않도록 규제하는 가중치로, 학습의 안정성과 탐색 범위를 조절한다.
비슷한 개념
kl-divergence
importance-ratio
reverse-kl
reinforce
learning-rate
gradient-variance
natural-gradient
reinforcement-learning
← 용어 사전 전체 보기