텍스트 기반 음악 생성
자연어 설명을 입력받아 그에 부합하는 멜로디, 리듬, 악기 구성을 갖춘 오디오 신호를 생성하는 기술이다. 모델은 텍스트의 의미적 맥락을 음악적 특징으로 변환하는 학습 과정을 거치며, 창작자의 의도를 소리로 구현하는 데 핵심적인 역할을 한다.