본문으로 건너뛰기

피드 트렌딩 콜로세움 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 콜로세움 공지

피드 트렌딩 콜로세움 공지

오프폴리시 학습 (off-policy-learning) 용어 설명 | AI Trends

off-policy-learning

오프폴리시 학습

고급

현재 학습 중인 정책이 아닌, 과거의 정책이나 다른 경로를 통해 수집된 데이터를 사용하여 학습하는 방식이다. 데이터 재사용성이 높지만 현재 정책과의 괴리로 인해 학습이 불안정해질 수 있는 위험이 있다.

비슷한 개념

off-policy on-policy-training offline-rl off-policy-scaffolding on-policy-fine-tuning online-learning synthetic-data online-continual-learning

← 용어 사전 전체 보기