구글, 정교하고 자연스러워진 AI기반 번역 서비스 선보여
“AI는 구글의 최종 도착지가 될 것입니다. 구글은 사용자가 원하는 것을 정확히 이해하고, 가장 적합한 답을 줄 것입니다. 물론 그 지점에 도달하기에는 아직 한참 멀었지만, 우리는 점차 더 가까워질 수 있으며, 그것이 기본적으로 우리가 가고 있는 방향입니다”
지난 2000년, 구글 공동창업자인 래리 페이지가 인공지능(AI) 시대를 기대하며 한 말이다. 올해 구글 창업자의 편지(Founder’s Letter)에서 순다 피차이 구글 CEO 역시 “앞으로 컴퓨터는 일상에 도움을 주는 AI로 대체될 것이다. ‘모바일 퍼스트(Mobile-first)’에서 ‘AI 퍼스트(AI-first)’인 세상으로 이동하고 있는 것이다”고 말하며 AI에 대한 중요성을 역설했다.
AI는 실용 소프트웨어 엔지니어링 툴로서 이미 매일 전 세계 수백만 명을 돕는 데 사용되고 있다. 오늘날 구글의 많은 제품은 AI의 한 분야인 머신러닝을 적극적으로 활용한다. 머신러닝은 축적되는 데이터를 통해 학습하는 알고리즘을 연구한다. 이러한 머신러닝의 발전은 구글 제품에서도 다양한 기능의 개선을 가져다 주었다. 예를 들어, 2개 국어 텍스트에서 일정 패턴을 학습하는 구글 번역은 하루에 천억 개 이상의 단어를 100개 이상의 언어로 번역하며 이 숫자는 계속 늘어나고 있다. 구글 포토는 최신 이미지 인식 툴을 사용해 피사체와 개념을 자동으로 분류해 ‘포옹’, ‘보더 콜리’ 등과 같이 원하는 어떤 단어로도 사진을 찾을 수 있다. 또한, 구글 어시스턴트는 자연어 처리 기술로 사용자가 의도한 바를 파악하고 딥러닝 기술로는 검색 결과의 순위를 결정하는 등 다양한 분야에 걸쳐 머신러닝을 응용하고 있다.
구글코리아가 29일 역삼동 구글코리아 사무실에서 ‘AI 혁신의 시대: 구글 포토와 구글 번역’ 기자간담회를 개최하고, AI 기반 ‘구글 포토(Google Photos)’ 및 ‘구글 번역(Google Translate)’의 새로운 기능을 소개했다.
올해로 출시 10년째를 맞는 구글의 번역 서비스인 구글 번역은 현재 전 세계 5억 명 이상이 매일 1천억 회 이상 사용하는 구글의 대표적인 서비스로, 총 103개 언어를 지원하고(교차 언어조합은 10,506개), 텍스트·사진·음성·손글씨 등 다양한 입력 방법을 제공하고 있다.
이번 기자간담회에서는 AI기술을 통해 향상된 신경망 기계번역 기술을 소개했다. 기존에 문장 내 구문 단위(Phrase-Based Machine Translation, PBMT)로 번역하던 수준에서 진화해, 인간의 언어 구사 방식과 유사하게 전체 문장을 하나의 번역 단위로 간주해 한 번에 번역하는 ‘구글 신경망 기계번역(Google Neural Machine Translation, GNMT)’ 기술이 적용된 것이다. 현재 GNMT 기술이 적용된 언어는 한국어를 비롯해 영어, 프랑스어, 독일어, 스페인어, 포르투갈어, 중국어, 일본어, 터키어 등의 8개 언어 조합이며 앞으로 지속해서 확대 적용될 예정이다. 또한, 머신러닝을 통해 많은 데이터를 학습할수록 한층 더 정교한 번역 품질을 제공할 수 있게 된다.
버락 투로프스키(Barak Turovsky) 구글 번역 프로덕트 매니지먼트 총괄은 “신경망 기계번역 기술 덕분에 구글 번역은 위키피디아 및 뉴스매체의 샘플문장을 기준으로 주요 언어 조합을 평가대상으로 했을때 번역 오류가 55%에서 85%가량 현저히 감소하는 등 지난 10년간 쌓아온 발전 그 이상의 결과를 단번에 이룰 수 있었다”며, “더욱 정교하고 자연스러운 번역을 제공하는 구글 번역 서비스로 전 세계 사용자들이 언어의 장벽 없이 원활하게 소통하는 데 도움이 될 수 있기를 바란다”고 말했다.
숫자로 보는 구글 번역
- -전세계 103개 언어 번역, 총 온라인 사용자의 99%를 커버
- -5억명 이상이 사용, 매일 1천억회의 번역이 이루어지고 있음
- -가장 많이 사용되는 언어 조합은 영어-스페인어, 영어-아랍어, 영어-러시아어, 영어-포르투갈어, 영어-인도네시아어 등
- -92% 트래픽이 미국 이외에서 발생. 가장 많이 사용하는 국가는 브라질
올해로 10주년 맞은 구글 번역
- -다양한 언어 지원: 2개 언어로 시작한 구글번역은 10년이 지난 현재 103개 언어를 지원할 만큼 성장했고 사용자도 수억 명으로 늘어났다.
- -손쉬운 사용법: 구글 검색 내에서 원하는 것을 입력하거나 말하면(“오케이 구글, 강아지를 프랑스어로 번역해줘”), 바로 구글 번역 결과를 확인할 수 있다. 검색창에 “번역”이라고 입력해도 바로 구글 번역을 이용할 수 있다.
- -신기한 워드 렌즈 기능: 번역 앱의 즉석 카메라 번역 기능을 사용하면 텍스트에 카메라를 대는 순간 바로 텍스트가 번역된다. 이 기능은 현재 28개 언어에서 지원되며, 표지판이나 메뉴와 같은 빠른 번역이 필요한 경우나 여행 시 안성맞춤이다. 인터넷 연결 없이도 이 기능은 사용 가능하다.
- -사진속 텍스트 번역 하기: 구글 번역은 휴대폰 카메라를 통해 광학 문자 인식(OCR) 기술을 사용해 37개 언어의 복잡한 구문들을 인식하고 번역할 수 있다. 번역하고 싶은 이미지를 업로드할 수도 있다
- -더 똑똑해진 신경망 기계번역: 최근 도입된 신경망 기계번역 기술은 8개 언어 조합(영어-프랑스어, 영어-독일어, 영어-스페인어, 영어-포르투갈어, 영어-중국어, 영어-일본어, 영어-한국어, 영어-터키어)에 적용되었다. 이는 전 세계 인구의 약 3분의 1이 사용하는 모국어이며, 전체 구글 번역 검색 요청의 35% 이상을 차지한다.