최적화 도구
모델의 가중치를 업데이트하여 손실 함수를 최소화하는 수학적 알고리즘이다. Adam, SGD 등이 대표적이며 학습의 속도와 수렴 안정성을 결정하는 핵심 요소이다. 에이전트는 다양한 최적화 알고리즘과 그 내부 파라미터를 실험하여 특정 모델 구조에 가장 적합한 방식을 스스로 찾아낸다.