
AI 오디오 테크 기업 스트라가 사용자의 음성을 복제해 TTS(음성 합성)를 만들 수 있는 서비스 ‘stra.ai’를 공식 출시했다.
이 서비스는 딱딱한 로봇음이 아닌 자연스러운 음성을 생성하는 기능을 제공한다. 일상 콘텐츠 제작부터 감정 연기가 요구되는 드라마, 영화 등의 극 콘텐츠 제작에도 활용될 수 있다.
30초 이상의 음성 샘플만 있으면 누구나 손쉽게 자신의 목소리를 클로닝할 수 있으며 생성된 모델은 다국어 지원이 가능해 한국어로 녹음된 음성도 영어, 일본어, 중국어 등 다양한 언어로 TTS 생성이 가능하다. 다양한 K-콘텐츠 기업들이 비용 절감과 제작 기간 단축 효과를 누릴 수 있으며 실제로 현재 해당 기술을 활용해 다국어 더빙 제작이 진행 중인 것으로 알려졌다.
스트라 김용호 대표는 “감정 시연을 할 수 있는 가이드 오디오 기능은 경쟁사에서 찾아볼 수 없는 독보적인 기능”이라며 “약 8초 가량의 연기 오디오 샘플을 첨부하면 TTS 모델이 그 연기를 참고하여 음성을 생성하는 기술로 외화 더빙, 오디오 북, 숏폼 드라마 등 다양한 콘텐츠 타입에 활용될 수 있다”고 설명했다.
스트라는 연내에 기본 제공 목소리를 100여 개 이상 확보하여 제공할 계획이며 추후 사용자들 간에 복제된 음성 모델을 유료로 공개 전환할 수 있는 마켓 플레이스도 론칭할 예정이다.
Leave a Comment