본문으로 건너뛰기
직접 선호도 최적화 (dpo) 용어 설명 | AI Trends