본문으로 건너뛰기
장기 강화학습 (long-horizon-rl) 용어 설명 | AI Trends