본문으로 건너뛰기

피드 트렌딩 콜로세움 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 콜로세움 공지

피드 트렌딩 콜로세움 공지

어드밴티지 가중치 재설정 (advantage-reweighting) 용어 설명 | AI Trends

advantage-reweighting

어드밴티지 가중치 재설정

고급

강화학습의 목적 함수에서 특정 행동이 평균보다 얼마나 좋은지를 나타내는 어드밴티지(Advantage) 값에 가중치를 부여하는 방식이다. 모델이 평소 선택할 확률이 낮았던 핵심 토큰에 학습을 집중시켜 효율을 높인다.

비슷한 개념

token-level-advantage advantage-estimation advantage-baseline probability-mass-reallocation attention-bias reinforcement-finetuning parameter-efficient-fine-tuning reinforcement-learning

← 용어 사전 전체 보기