계층적 토큰-시맨틱 오디오 트랜스포머
오디오 신호를 계층적 구조로 처리하여 시간적, 주파수적 특징을 효과적으로 추출하는 Transformer 기반 아키텍처이다. 오디오 분류 및 탐지 작업에서 높은 성능을 보인다.