트랜스포머 혼합 구조
공통된 백본 네트워크 위에 특정 작업(행동, 언어 등)에 특화된 전문가 모듈을 결합한 아키텍처이다. 하나의 모델로 여러 종류의 출력을 효율적으로 생성할 수 있다.