
앱 내 통화 기능으로 자연스러운 대화 데이터 확보…한국어·일본어부터 시작
인공지능(AI) 언어 데이터 전문 기업 플리토가 자사 모바일 애플리케이션 내 음성 데이터 수집 기능인 ‘아케이드 토킹 미션’을 고도화하며, 실사용 환경에 근접한 고품질 음성 데이터를 안정적으로 수집·가공할 수 있는 인프라를 강화했다.
이번 프로젝트는 글로벌 빅테크 기업의 수요에 기반해 기획된 것으로, 실제 사용자 간 자연스러운 통화 데이터를 수집한 뒤 체계적인 정제 및 라벨링 작업까지 완료함으로써, 음성인식(STT), 자연어처리(NLP), 객체 인식 등 다양한 AI 모델의 정교화에 최적화된 고정밀 학습용 데이터를 구축하는 데 초점을 맞추고 있다.
플리토의 아케이드 토킹 미션은 별도의 외부 앱이나 통화 연결 없이, 플리토 앱 내에서 직접 통화 기능을 활용해 대화를 진행하는 방식으로 설계됐다. 사전에 설정된 상황과 키워드를 바탕으로 사용자 간 자유로운 통화가 이뤄지며, 스크립트 기반의 인위적 대화 없이 실제 일상과 유사한 자연스러운 데이터 확보가 가능하다.
특히 이번 고도화를 통해 플리토는 앱 내 통화 기능의 완전 내재화, 상황 기반 자유 대화 설계, 참여 간소화 및 고품질 기준 정립, AI 학습용에 최적화된 제출 포맷 구축 등 전 주기적 음성 데이터 수집·가공 체계를 일원화했다. 플리토는 단순 수집에 그치지 않고, 수집된 데이터를 자체 품질 기준에 따라 정제한 뒤, 의미 기반의 정교한 라벨링 작업까지 마쳐 AI 모델 개발에 바로 활용 가능한 데이터로 완성한다.
해당 데이터는 언어별 특성과 사용 환경을 반영해 설계되며, 초기에는 한국어와 일본어를 중심으로 수집을 시작하며, 점진적 확대를 통해 아랍어, 말레이시아어, 중국어, 영어 등 다양한 언어군으로 확장할 계획이다. 완성된 음성 데이터셋은 플리토 고유의 품질 검수 프로세스를 거쳐 글로벌 빅테크 기업 및 주요 연구기관 등에 공급된다.
이정수 플리토 대표는 “이번 아케이드 토킹 미션 고도화는 기존 음성 데이터 수집 방식의 범위를 확장하며, 실제 사용 환경을 반영한 자연스러운 데이터를 안정적으로 확보할 수 있는 기반을 마련한 데 의미가 있다”며 “플리토는 음성 데이터를 단순히 수집하는 데 그치지 않고, 정제와 라벨링까지 전 과정을 자체 수행하는 전문 데이터 기업으로서, 앞으로도 다양한 언어와 상황에 최적화된 학습 데이터를 지속적으로 구축해 글로벌 AI 산업의 정밀화와 활용 저변 확대에 기여해 나가겠다”고 말했다.
Leave a Comment