음성 인식 및 합성
음성을 텍스트로 변환(STT)하거나 텍스트를 음성으로 변환(TTS)하는 기술이다. 로컬 AI를 알렉사와 같은 음성 비서 형태로 구현하기 위해 반드시 필요한 인터페이스 기술이다.