전사
오디오나 비디오의 음성 데이터를 텍스트로 변환하는 기술이다. 영상 편집에서 자막 제작의 기초가 되며, 최근 AI 모델의 발전으로 타임스탬프 정렬과 화자 분리 등 복잡한 작업의 정확도가 비약적으로 향상되어 작업 시간을 단축시킨다.