본문으로 건너뛰기

피드 트렌딩 콜로세움 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 콜로세움 공지

피드 트렌딩 콜로세움 공지

마르코프 결정 과정 (markov-decision-process) 용어 설명 | AI Trends

markov-decision-process

마르코프 결정 과정

중급

의사결정 과정을 수학적으로 모델링하는 프레임워크로, 현재 상태가 이전 상태와 독립적이라는 마르코프 성질을 가정한다. 강화학습의 이론적 기초가 되며, 에이전트가 보상을 최대화하기 위한 최적의 정책을 찾는 데 사용된다.

비슷한 개념

mdp long-horizon-rl deep-reinforcement-learning q-learning srdp reinforcement-learning memory-based-policy pomdp

← 용어 사전 전체 보기