본문으로 건너뛰기
AI Trends
피드
트렌딩
콜로세움
공지
로그인
피드
트렌딩
콜로세움
공지
상한 신뢰 구간 (ucb) 용어 설명 | AI Trends
ucb
상한 신뢰 구간
고급
강화학습에서 탐색과 활용의 균형을 맞추기 위한 알고리즘으로, 불확실성이 높은 경로에 가중치를 두어 새로운 가능성을 탐색하게 함.
비슷한 개념
exploration
simutil-ucb
q-learning
credit-horizon
probability-intervals
reinforcement-learning
deep-reinforcement-learning
stochastic-optimization
← 용어 사전 전체 보기