스타트업

IBM, 기업용 멀티모달 및 추론 가능한 그래니트 AI 모델 제품군 출시

IBM이 자사 거대언어모델(LLM) 제품군의 차세대 버전인 ‘그래니트(Granite) 3.2’를 출시했다.

그래니트 3.2 모델은 허깅 페이스(Hugging Face)에서 아파치 2.0 라이선스에 따라 사용할 수 있다. 일부 모델들은 IBM 왓슨x.ai, 올라마(Ollama), 리플리케이트(Replicate), LM 스튜디오에서 즉시 사용 가능하며, 조만간 레드햇 엔터프라이즈 리눅스(RHEL) AI 1.5에서도 제공될 예정이다.

주요 기능으로는 먼저 문서 해석 작업을 위한 새로운 ‘비전 언어 모델'(VLM)이 있다. 이 모델은 DocVQA, ChartQA, AI2D 및 OCRBench 등 필수 엔터프라이즈 벤치마크에서 기존 대형 모델인 라마 3.2 11B 및 픽스트랄 12B와 동등하거나 그 이상의 성능을 보여주었다. IBM은 풍부한 학습 데이터와 자체 오픈 소스 도클링(Docling) 도구를 활용해 8,500만 개의 PDF를 처리하고 2,600만 개의 합성 질문-답변 조합을 생성함으로써 복잡한 문서 중심 업무를 처리하는 VLM의 능력을 강화했다.

또한 3.2 2B 및 8B 모델에서는 향상된 ‘연쇄적 사고(Chain of thought)’ 기능을 제공한다. 사용자는 추론 기능을 활성화하거나 비활성화해 효율성을 최적화할 수 있다. 이 기능을 통해 8B 모델은 안전성이나 성능 저하 없이 아레나하드(ArenaHard) 및 알파카이벨(AlpacaEval)과 같은 벤치마크에서 이전 모델보다 두 자릿수 개선을 달성했다. 그래니트 3.2 8B 모델은 새로운 추론 확장 방법으로 AIME2024 및 MATH500과 같은 수학 추론 벤치마크에서 클로드 3.5-소넷이나 GPT-4o 같은 대규모 모델의 성능에 필적하도록 보정 가능하다.

IBM은 또한 기존 그래니트 3.1 가디언 모델의 성능을 유지하면서 크기를 30% 줄인 ‘그래니트 가디언(Granite Guardian)’ 안전 모델의 소형화 버전을 공개했다. 3.2 모델에는 안전 모니터링의 모호성을 인식하고, 더 정교한 위험 평가를 제공하는 ‘언어화된 신뢰도’라는 새로운 기능이 도입됐다.

그래니트 3.2는 기업을 위한 작고 실용적인 AI를 제공하기 위한 IBM의 포트폴리오 진화에 중요한 진전을 이루었다. 예를 들어, ‘연쇄적 사고’ 접근 방식은 강력하지만 모든 작업에 필요한 것은 아니며 상당한 컴퓨팅 성능이 필요하다. 이에 IBM은 프로그래밍 방식으로 ‘연쇄적 사고’를 활성화 또는 비활성화할 수 있는 기능을 도입했다. 간단한 작업의 경우 이 모델은 추론 없이 작동하므로 불필요한 연산 부하를 줄일 수 있다.

IBM은 그래니트 3.2 모델과 함께 최대 2년 후의 미래까지 장기 예측할 수 있는 기능을 갖춘 차세대 시계열 모델인 ‘타이니타임믹서'(TTM, TinyTimeMixers) 모델도 출시했다. 이 모델은 1000만 개 미만의 매개변수로 작동하며, 금융 및 경제 동향, 공급망 수요 예측, 유통 업계의 계절별 재고 계획 등 장기적인 트렌드 분석에 활용될 것으로 기대된다.

IBM AI 연구 담당 스리람 라가반(Sriram Raghavan) 부사장은 “다음 AI 시대는 기업이 과도한 컴퓨팅 비용 없이도 강력한 성과를 달성할 수 있는 효율성, 통합 가능성, 실용성이 화두가 될 것”이라며, “개방형 솔루션에 중점을 둔 IBM의 최신 그래니트 모델은 오늘날 기업들의 AI 접근성, 비용 효율성, AI 자체의 가치를 높이는 데 도움을 줬다고 생각한다”고 말했다.

기자 : 혁신적인 스타트업들의 이야기를 발굴하고 전달하며, 다양한 세계와 소통하는 것을 추구합니다. / I want to learn about and connect with the diverse world of startups, as well as discover and tell their stories.

댓글

Leave a Comment


관련 기사

스타트업

엔닷라이트, 엔비디아 GTC 2025에서 3D 합성 데이터 생성 솔루션 공개

트렌드

[법무법인 비트] AI 기반 맞춤형 건강기능식품의 시대! 국내외 시장 동향, 혁신 사례, 전망 살펴보기

스타트업

다국어 AI ‘챗수트라’, 한 달 만에 100만 이용자 확보

스타트업

셀렉트스타, ‘SXSW2025’서 캐릭터 AI 기술 선보여