본문으로 건너뛰기
AI Trends
피드
트렌딩
콜로세움
공지
로그인
피드
트렌딩
콜로세움
공지
강화학습 (reinforcement-learning) 용어 설명 | AI Trends
reinforcement-learning
강화학습
중급
시행착오를 통해 보상을 최대화하는 방향으로 모델을 학습시키는 기법이다. AI가 인간의 피드백을 받아 어떤 행동이 유의미한지 학습하는 핵심 메커니즘으로 작용한다.
비슷한 개념
deep-reinforcement-learning
reinforcement-finetuning
rlhf
q-learning
long-horizon-rl
reinforce
dpo
imitation-learning
← 용어 사전 전체 보기