스타트업

크라우드웍스, ‘국가대표 AI’ 개발 데이터 공급기관 참여

‘독자 AI 파운데이션 모델 개발’ 위한 공동 데이터 공급 나서

정부, 데이터 공동 구매에 연간 100억원 지원…STEM·도서·산업 특화 데이터 등 강점

AI 테크 기업 크라우드웍스가 과학기술정보통신부가 추진하는 ‘독자 AI 파운데이션 모델 프로젝트’에 선정된 5개 개발팀이 활용할 공동 데이터 공급기업에 참여한다.

지난 4일 ‘국가대표 AI’ 개발 사업에 선정된 5개 개발팀(네이버, LG AI연구원, NC AI, SK텔레콤, 업스테이지)이 선정됐다. 이들 팀은 정부로부터 데이터, 인재, 고성능 GPU 등 전방위적 지원을 받게 되며, 데이터 분야에서는 5개 팀에 데이터 공동구매(100억원), 팀별 데이터셋 구축(28억원), 고품질 방송영상 데이터(200억원) 등의 지원이 예정돼 있다.

이와 관련해 크라우드웍스는 5개 개발팀이 AI 개발에 활용할 공동 데이터 제공에 나선다. 크라우드웍스는 국내에서 규모의 고품질 AI 학습 데이터를 공급할 수 있는 기업으로, 품질과 신뢰성을 안정적으로 확보한 고품질 데이터를 지원할 예정이다.

특히 이번에는 국내에서 구하기 힘든 데이터셋들을 공급하기로 해 주목된다. 저작권 문제를 합법적으로 해결한 ‘STEM 데이터셋’과 국내 도서 데이터셋, 국내외 뉴스 데이터, 국어학 데이터 등이 포함된다. STEM 데이터셋은 과학(Science), 기술(Technology), 공학(Engineering), 수학(Mathematics) 등 고차원적 전문 지식이 담긴 데이터셋으로, AI의 추론·분석·문해 역량 향상에 기여할 수 있다.

모든 데이터는 크라우드웍스가 직접 구축하거나 자체 검수 시스템을 통해 전문성과 품질을 검증한 것으로 데이터 정확도와 신뢰도를 높인 것이 특징이다. 이를 바탕으로 개발팀의 개발 방향에 따라 맞춤형 데이터셋 공급이 가능하다는 점도 강점으로 작용한다.

김우승 크라우드웍스 대표는 “AI 모델의 성능은 결국 데이터를 기반으로 결정된다”며 “국내외에서 인정받은 데이터 품질과 전문성을 바탕으로, 개발팀의 성공적인 AI 모델 개발에 기여할 수 있기를 기대한다”고 말했다.

한편, 크라우드웍스는 ‘A1 데이터 마켓플레이스’를 통해 텍스트, 음성, 이미지, 영상, 센서 등 멀티모달 데이터는 물론, 산업 특화 도메인까지 폭넓은 데이터들을 제공하며 국내 데이터 생태계 활성화에 기여하고 있다.

플래텀 에디터 / 스타트업 소식을 가감 없이 전하기 위해 노력하겠습니다.

댓글

Leave a Comment


관련 기사

스타트업

플리토, 업스테이지 ‘독자 AI 파운데이션 모델’ 국책사업 데이터 파트너로 참여

스타트업

슈퍼브에이아이, LG AI연구원 컨소시엄에서 ‘K-피지컬 AI’ 개발 참여

스타트업

크래프톤, SK텔레콤과 ‘독자 AI 파운데이션 모델’ 프로젝트 정예팀 선정

스타트업

셀렉트스타, SKT 컨소시엄으로 ‘K-AI 파운데이션 모델’ 개발 참여