네이버, 멀티모달 AI로 클로바X 능력 확장
네이버가 자사의 대화형 AI 에이전트 클로바X(CLOVA X)를 멀티모달(Multimodal) AI로 고도화하며 생성형 AI 기술 경쟁력을 한층 강화하고 있다. 이번 업그레이드로 클로바X는 텍스트뿐만 아니라 이미지와 음성도 동시에 처리할 수 있는 능력을 갖추게 된다.
네이버는 오는 27일 클로바X 서비스 업데이트를 통해 시각 정보 처리 능력을 새롭게 추가할 예정이다. 이를 통해 사용자들은 이미지를 업로드하고 AI와 대화를 나눌 수 있게 된다. 클로바X는 사진 속 현상을 묘사하거나 상황을 추론하는 등 다양한 작업을 수행할 수 있으며, 표와 그래프 분석도 가능하다.
네이버 관계자는 “클로바X의 이미지 이해 능력을 바탕으로 개인의 생산성 향상 도구로서의 활용 범위가 한층 넓어질 것”이라고 전망했다.
특히 주목할 만한 점은 클로바X의 우수한 성능이다. 대한민국 초·중·고등학교 검정고시 총 1,480개 문항을 이미지 형태로 입력하고 문제를 풀게 한 결과, 클로바X는 약 84%의 정답률을 기록했다. 이는 오픈AI의 GPT-4가 기록한 78%보다 높은 수치다.
네이버는 또한 20일 ‘클로바’ 공식 사이트의 기술 블로그를 통해 하이퍼클로바X 기반의 음성 AI 기술도 공개했다. 이 기술은 기존의 음성 인식 및 합성 기술보다 한층 발전한 모델로, 거대 언어 모델(LLM)의 특징인 뛰어난 문맥 이해 및 지시문 해석 능력을 활용해 자연스러운 대화가 가능하다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 “하이퍼클로바X의 발전된 능력은 클로바X를 비롯한 여러 네이버 서비스에 도입해 새로운 사용자 가치를 창출하고, 기업용 AI 솔루션으로도 제공하며 하이퍼클로바X 생태계를 더욱 확장해나갈 것”이라고 밝혔다.
네이버는 이러한 기술 발전 과정에서 ‘AI 안전성’도 적극적으로 고려하고 있다. 지난 6월 공개한 ‘네이버 ASF(AI Safety Framework)’를 통해 AI 시스템의 잠재적 위험을 평가하고, 특히 음성 AI 기술에 대해서는 보다 안전한 서비스 제공을 위해 다각도로 검토를 이어갈 계획이다.