확률적 최적화
무작위성이나 노이즈가 포함된 시스템에서 최적의 파라미터를 찾는 과정이다. AI 에이전트의 행동이나 사람의 피드백처럼 결과가 매번 조금씩 달라지는 환경에서 안정적인 성능 향상을 목표로 하며, 노이즈를 평균화하여 실제 성능을 추정하는 것이 핵심이다.