‘AI로 혐오표현 탐지’ 튜닙, 윤리성 판별, 비식별화 등 11가지 API 공개
자연어처리 중심의 AI 스타트업 튜닙이 윤리성 판별, 비식별화 등 11가지 API 제품을 론칭했다.
튜닙은 카카오브레인 자연어처리 팀 멤버들이 공동 창업한 AI 스타트업이다. 자연어처리, 초대규모(Hyperscale) AI 등 고난도 AI 기술을 자체 개발 중이며, 지난해 11월 펄어비스캐피탈, DSC인베스트먼트, 네이버 D2SF로부터 30억 원 규모의 시드 투자를 유치해 기술력을 입증했다.
이번에 튜닙이 공개한 서비스는 자체 개발한 자연어처리(NLP) 엔진 기반의 한국어·영어 API 서비스다. 별도의 추가 코딩이나 배경지식 없이도 사용자가 원하는 단어나 문장을 입력하면 AI가 자동으로 인식해 적합한 결과를 제공한다.
튜닙이 공개한 API 중 가장 주목받는 것은 ‘윤리성 판별(Safety Check)’ API다. 사용자가 텍스트를 입력하면 튜닙의 딥러닝 모델이 문맥을 분석한 뒤 혐오 표현을 자동 탐지해 모욕, 욕설, 폭력/위협, 범죄 조장 등 11가지 항목으로 분류한다. 여기에 더해, 해당 혐오 표현의 심각성을 주의, 명백, 심각 등 3단계로 구분하고, 순화 표현으로 대체한 결과를 같이 보여준다. 최근 심각성이 대두되고 있는 AI 윤리 및 인터넷 혐오 문제를 해결하는 데 다양하게 응용 가능하다.
튜닙의 ‘비식별화’ API는 개인정보보호 및 데이터 활용에 유용한 제품이다. 정부에서 발표한 개인정보 비식별 조치 가이드라인에 따라, 사용자가 입력한 문장에서 이름, 주소, 전화번호, 주민등록번호 등 14개 개인정보 항목을 자동 판별해 삭제, 마스킹, 범주화 등의 방식으로 비식별화한다. 마이데이터가 금융, 의료, 마케팅 등 다양한 분야에서 활용되는 상황에서, 데이터 효용과 개인정보보호를 모두 실현할 수 있어 고객 수요가 높은 제품이다.
튜닙은 이 밖에도 텍스트 분석, 이미지 분석, 영상 분석, 방언 번역, 어린아이 목소리 합성, 감정 분류, 정치 성향 예측, N행시, 단어 그래프 등 다양한 서비스에 적용 가능한 API 서비스를 공개했다.
튜닙은 이번 API 공개를 시작으로, 본격적인 B2B 및 B2B2C 사업 확장에 나설 계획이다. 현재 다양한 기업들과 협력을 논의 중이며, 대부분 AI 기반 사업을 고도화 중이거나 자연어 기반의 AI 서비스 도입을 희망하는 기업들이다.
박규병 튜닙 대표는 “많은 기업이 영상인식 기반 API에 집중하고 있지만, 우리는 자연어처리 분야에 집중해 기존에 없던 차별화된 API 제품을 준비했다”며 “윤리성 판별 등은 실제 현장에서 실용성과 유용성을 입증한 제품들로, 고객들의 목소리를 반영하여 서비스를 고도화하는 한편, 가치 있는 여러 API를 연달아 선보일 것”이라고 말했다.