트웰브랩스, CB인사이트 ‘글로벌 100대 AI 스타트업’ 3년 연속 선정
영상이해 초거대 AI 개발 기업 ‘트웰브랩스(Twelve Labs)’가 글로벌 리서치 기업 CB인사이트(CB Insights)가 발표한 2024년 글로벌 100대 AI 스타트업 ‘AI 100’(AI 100: The most promising artificial intelligence startups of 2024)에 선정됐다. 2022년 국내 기업으로는 유일하게 선정된데 이어 2023년, 2024년 3년 연속 선정이며, 23년 ‘세계 50대 생성 AI 스타트업’에도 선정된 바 있다.
CB인사이트는 거래 활동, 파트너십, 팀 역량, 투자사, 특허 현황 등을 고려하여 세계 유망 AI 기업 100곳을 선정했다고 설명했다. 이번 ‘AI 100’에는 올해 초 7360만 달러(약 990억 원) 규모의 투자를 유치하며 화제를 모은 퍼플렉시티, 미스트랄 AI, 앤트로픽, 오픈AI 등 글로벌 AI 기업이 포함되었다.
트웰브랩스는 독보적인 멀티모달 신경망 기술을 바탕으로 글로벌 영상 시장 내 오픈AI, 구글과 어깨를 나란히 하고 있다. 2022년 말 오라클과의 대규모 클라우드 파트너십을 통해 수천 대의 최신 엔비디아 GPU를 확보하며 모델 고도화를 이루어냈다. 지난해 엔비디아, 인텔, 삼성넥스트, 한국투자파트너스 등으로부터 천만 달러(한화 약 140억 원) 규모의 전략적 투자를 유치하여 화제를 모은 바 있다. 현재 트웰브랩스의 누적 투자 금액은 약 2,700만 달러(약 360억원)에 달한다.
트웰브랩스는 오픈AI, 구글 등 글로벌 기업들이 텍스트 및 이미지 분야에 집중하던 초창기부터 ‘영상이해’ 모델 개발에 집중하여 영상이해 시장의 선두주자로 자리 잡았다. 지난 3월 출시한 초거대 AI 영상 언어 생성 모델 ‘페가수스(Pegasus-1)’ 및 멀티모달 영상이해 모델 ‘마렝고(Marengo 2.6)’는 구글의 제미나이 1.5프로, 오픈AI의 GPT-4V 등 상용 및 오픈소스 영상 언어 모델과 비교해 최대 43%가량 성능 우위를 보인다고 밝혔다.
영상이해는 영상 생성과는 달리 언어, 이미지, 등장인물 등 유형 정보를 이해하고, 이를 바탕으로 한 통합적인 추론이 요구된다. 트웰브랩스의 영상이해 모델은 ‘영상 표현(Video Representation Learning)’ 연구와 ‘영상언어 정렬(Video Language Alignment)’ 연구로 영상 속 다양한 정보 유형들을 마치 사람처럼 이해 가능하다. 따라서 영상에 대한 요약, 하이라이트 생성, 영상 기반 텍스트 생성, 분야별 영상 자동 분류 등 다양한 작업이 가능하다.
트웰브랩스 이재성 대표는 “트웰브랩스가 CB인사이트에 선정된 것은 이번이 4번째인 만큼 혁신 스타트업에서 글로벌 주요 키플레이어로 자리매김한 것 같아 기쁘다”며, “영상이해 기술 지속 고도화로 스포츠, 미디어 및 엔터테인먼트, 물리보안 등 다양한 산업 영역에서 트웰브랩스의 기술을 확산해나가겠다”고 밝혔다.