
네이버클라우드가 시각·청각 정보를 동시에 처리하는 자체 기술 기반의 AI 모델을 공개했다.
네이버클라우드는 29일 과학기술정보통신부의 ‘독자 AI 파운데이션 모델’ 연구 과제 성과물인 ‘하이퍼클로바X SEED 8B Omni(이하 옴니모델)’와 ‘하이퍼클로바X SEED 32B Think(이하 추론모델)’ 등 2종을 오픈소스로 공개했다고 밝혔다.
이번에 공개된 ‘옴니모델(8B Omni)’은 텍스트, 이미지, 오디오 등 서로 다른 형태의 데이터를 단일 모델에서 학습하는 ‘네이티브 옴니모달’ 구조를 적용했다. 기존 멀티모달 방식이 텍스트와 이미지 모델을 각각 결합하는 형태였다면, 이 모델은 설계 단계부터 다양한 데이터를 통합적으로 학습해 맥락 이해도를 높인 것이 특징이다. 텍스트 지시에 따라 이미지를 생성하거나 편집하는 기능도 수행한다.
함께 공개된 ‘추론모델(32B Think)’은 기존 추론형 AI에 시각 이해, 음성 대화, 도구 활용 기능을 더한 모델이다.
네이버클라우드 측에 따르면, 해당 추론모델로 올해 대학수학능력시험(수능) 문제를 풀이한 결과 국어, 수학, 영어, 한국사 등 주요 과목에서 1등급에 해당하는 점수를 기록했다. 특히 영어와 한국사 영역에서는 만점을 받았다. 텍스트로 변환된 문제가 아니라 이미지 형태의 문제를 직접 인식해 풀이했다는 점이 특징이다.
또한 글로벌 AI 평가 기관인 ‘아티피셜 애널리시스(Artificial Analysis)’의 주요 10개 벤치마크 평가에서도 글로벌 상위 모델들과 유사한 수준의 성능 지표를 보였다고 회사 측은 설명했다.
네이버클라우드는 이번 모델 공개를 시작으로 인터넷 문서 외에 현실 세계의 다양한 데이터를 확보해 학습시키는 한편, 단계적인 모델 스케일업(규모 확대)을 추진할 계획이다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 “텍스트, 시각, 음성 등 AI의 감각 영역을 확장하고 사고와 추론 능력을 강화했을 때 문제 해결 능력이 향상됨을 확인했다”며 “검증된 구조를 바탕으로 향후 점진적인 규모 확장을 진행할 것”이라고 말했다.



![[Startup’s Story #511] "교실에서는 안 되겠더라고요" - 어느 창업자의 DAY1 unnamed (1)](https://platum.kr/wp-content/uploads/2025/12/unnamed-1-10-150x150.jpg)



댓글 남기기