“허깅페이스 다운로드 점유율 중국 17.1% vs 미국 15.8%”

스탠포드대 연구팀이 중국 오픈소스 AI 모델의 급부상을 다룬 보고서를 발표했다. 미국 담론이 딥시크(DeepSeek)에 집중된 사이, 중국에서는 다양한 오픈웨이트 모델 생태계가 성장하고 있다는 분석이다.
스탠포드 인간중심 AI연구소(HAI)와 사이버정책센터(SPC)가 12월 공동 발표한 ‘Beyond DeepSeek’ 보고서에 따르면, 2025년 9월 알리바바의 Qwen 모델 패밀리가 메타의 Llama를 제치고 허깅페이스 최다 다운로드 모델이 됐다. 같은 시점 허깅페이스 다운로드 점유율은 중국 개발사가 17.1%, 미국 개발사가 15.8%를 기록했다.
보고서는 “미국의 AI 우위가 클로즈드 모델에서는 유지되지만, 오픈 모델에서는 중국이 따라잡았거나 앞섰을 수 있다”고 평가했다.
딥시크 너머의 생태계
보고서가 주목한 건 딥시크만이 아니다. 알리바바 Qwen, 문샷 Kimi, 칭화대 GLM 등 다양한 모델 패밀리가 각자의 강점을 갖고 성장하고 있다.
허깅페이스 기준 2025년 9월 파생 모델(파인튜닝·증류 모델)의 63%가 중국 모델 기반이었다. 오픈소스 성능 상위 25개 릴리스 중 22개가 중국 5개 연구소에서 나왔다. 보고서는 이를 두고 “딥시크가 미국의 관심을 독점했지만, 실제로는 훨씬 다양한 생태계”라고 분석했다.
모델별 특성도 구분된다. Qwen3는 119개 언어를 지원하며 다국어에 강하다. DeepSeek-R1은 강화학습 기반 추론에 특화됐고, Kimi-K2는 코딩과 에이전트 작업에서 두각을 나타낸다. GLM-4.5는 범용 성능을 목표로 한다.
글로벌 확산과 정책적 함의
중국 오픈소스 모델의 확산은 미국에도 영향을 미친다. 보고서에 따르면 허깅페이스에서 중국 모델을 다운로드한 사용자 중 미국이 가장 큰 비중을 차지한다. Qwen 다운로드의 약 20%가 미국에서 발생했다.
동시에 중국 내에서도 채택이 빠르다. 2025년 2월 기준 최소 72개 중국 지방정부 기관이 딥시크 모델을 통합했다.
보고서는 안전 리스크도 지적한다. 스탠포드 산하 CAISI(인간중심 AI 안전 이니셔티브) 평가에서 딥시크 모델은 미국 모델 대비 탈옥(jailbreaking) 공격에 평균 12배 취약한 것으로 나타났다. 검열 관련 편향, 데이터 보안 우려도 제기됐다.
정책 권고: “중국과 교류하라”
보고서의 핵심 권고는 역설적이다. 중국 오픈소스 AI의 부상에 대응해 “중국 AI 커뮤니티와 교류해야 한다”는 것이다.
구체적으로 네 가지를 제안했다. 첫째, 글로벌 의존성을 인식하고 미국 오픈소스 생태계에 투자할 것. 둘째, AI 거버넌스 논의에서 중국과 대화 채널을 유지할 것. 셋째, 중국 모델의 안전성을 독립적으로 평가할 것. 넷째, 오픈 모델을 지정학적 경쟁의 자산으로 활용할 것.
보고서는 “냉전 시대에도 미국과 소련은 핵 사고 방지를 위해 소통했다”며 “AI 안전 프레임워크에서도 유사한 접근이 필요하다”고 밝혔다.
한국 기업들은 어떤 선택을 하고 있나
보고서는 중국 오픈소스 모델의 글로벌 확산을 다루면서도 한국 기업들의 대응에 대해서는 언급하지 않았다. 국내 양대 플랫폼 기업인 네이버와 카카오는 현재 상반된 AI 전략을 추진하고 있다.
네이버는 ‘소버린 AI(Sovereign AI)’ 전략을 고수한다. 2023년 8월 자체 개발 LLM ‘하이퍼클로바X’를 공개한 이후 이를 검색, 커머스, 클라우드 등 자사 서비스 전반에 적용하는 ‘온 서비스 AI’ 전략을 펼치고 있다. 2025년 2월에는 기존 모델 대비 파라미터 수를 40% 줄이면서 운영 비용을 50% 이상 절감한 경량화 모델을 공개했고, 5월에는 오픈소스 모델 ‘하이퍼클로바X 시드’도 배포했다. 태국, 일본 등 해외 시장에서도 자체 모델을 기반으로 사업을 확장하고 있다.
카카오는 다른 길을 택했다. 2024년 10월 발표한 ‘AI 모델 오케스트레이션’ 전략은 자체 개발 모델뿐 아니라 외부의 검증된 모델을 적재적소에 활용하겠다는 것이다. 2025년 2월 오픈AI와 전략적 제휴를 체결했고, 자체 모델 ‘카나나’와 외부 API를 조합해 서비스를 구축하고 있다.
주목할 점은 양사 모두 중국 오픈소스 모델(Qwen, DeepSeek 등)을 직접 채택한 사례가 확인되지 않는다는 것이다. 네이버는 자체 모델 고수를, 카카오는 오픈AI와의 협력을 선택했다. 이는 데이터 보안 우려, 검열 이슈, 그리고 기존 생태계와의 호환성 등 복합적인 요인이 작용한 것으로 보인다. 다만 스타트업이나 중소기업 영역에서는 비용 효율성 때문에 중국 오픈소스 모델 활용이 늘어날 가능성이 있다.
바이든에서 트럼프로: 오픈소스 AI에 대한 시각 변화
보고서가 언급한 ‘트럼프 행정부의 America’s AI Action Plan’은 바이든 행정부의 AI 정책과 근본적으로 다른 방향을 제시한다. 이 맥락을 이해해야 보고서의 권고가 어떤 의미인지 파악할 수 있다.
바이든 전 대통령은 2023년 10월 ‘안전하고 신뢰할 수 있는 AI 개발 및 사용에 관한 행정명령(E.O. 14110)’을 발표했다. 핵심은 규제다. 국가 안보, 경제, 공중보건에 위험을 초래할 수 있는 AI 시스템 개발자에게 안전성 테스트 결과를 정부에 공유하도록 의무화했고, 모델 편향 문제 해결, 사이버보안 위협 평가 등을 연방 기관에 지시했다.
트럼프 대통령은 취임 첫날(2025년 1월 20일) 이 행정명령을 폐지했다. 2025년 7월에는 ‘AI 행동계획’을 발표하며 완전히 다른 방향을 제시했다. 핵심 기조는 세 가지다: AI 혁신 가속화, AI 인프라 구축, 국제 AI 외교·안보 주도. 구체적으로는 AI 소프트웨어·하드웨어의 동맹국 수출 확대, 주(州)별 AI 규제 일원화(과도한 규제 시 연방자금 제한), 데이터센터 건설을 위한 환경규제 완화 등이 포함됐다.
주목할 점은 오픈소스에 대한 태도 변화다. 바이든 행정부는 AI 확산 제한 조치를 포함했지만, 트럼프 행정부의 계획은 NTIA(통신정보관리청)가 중소기업의 오픈소스·오픈웨이트 모델 채택을 지원하는 이해관계자 협의체를 구성하도록 명시했다. 즉, 스탠포드 보고서가 권고하는 “중국 오픈소스 AI와의 교류”는 트럼프 행정부의 기조와 어느 정도 정렬될 수 있다. 다만 보고서가 제안하는 “AI 거버넌스 협력”이 현 행정부의 대중국 강경 기조와 양립할 수 있을지는 불확실하다.
딥시크 이후, 중국 AI 생태계의 재편
보고서는 미국 시각에서 중국 오픈소스 AI 생태계를 분석했다. 중국 내부에서는 어떤 변화가 일어나고 있을까?
대외경제정책연구원(KIEP) 자료에 따르면, 딥시크의 등장은 중국 AI 스타트업 생태계에 큰 혼란을 가져왔다. 2025년 2월 말 기준 중국 98개 중앙 국유기업 중 45%가 딥시크 모델을 도입했다. 많은 대기업과 중소 하드웨어 제조업체들이 ‘딥시크 통합 기기 서비스’를 출시하고 있다.
보고서가 “타이거 AI 유니콘(tiger AI unicorns)”으로 분류한 6개 스타트업(중국 언론에서는 ‘6소룡(六小龍)’으로 불리지만, 이 표현은 보고서 원문에는 등장하지 않는다)도 전략을 수정하고 있다. 제로원(零一万物)은 자체 Yi 모델 개발에만 고집하지 않고 딥시크, Qwen 등 주류 모델과 호환되는 제품을 개발하기로 했다. 2025년 3월에는 기업용 AI 플랫폼을 발표해 딥시크 R1, 알리바바 Qwen, 자사 Yi 모델을 통합 제공한다. 문샷(Moonshot)은 마케팅 투자를 축소하고 자사 모델 Kimi의 장문 추론 능력 강화에 집중한다. 미니맥스(MiniMax)는 B2B 사업을 축소하고 비디오 생성 멀티모달 분야에 주력하기로 했다.
제로원 CEO 리카이푸(李開復)는 “중국 시장에 결국 딥시크, 알리바바, 바이트댄스 세 개의 주요 AI 모델 회사만 남을 것”이라고 전망했다. 이는 보고서가 묘사한 “다양한 중국 오픈소스 생태계”가 실제로는 소수 기업 중심으로 수렴하고 있음을 시사한다.
덧붙임
이 보고서는 허깅페이스 다운로드 수, 챗봇 아레나 순위 등 측정 가능한 지표로 현황을 정리한 점에서 가치가 있다. 다만 몇 가지 한계를 염두에 둘 필요가 있다.
첫째, 다운로드 수가 실제 프로덕션 배포를 의미하지 않는다. 보고서 스스로 “어떤 중앙 데이터 소스도 확산의 전체 그림을 갖고 있지 않다”고 인정했다.
둘째, 벤치마크 결과의 신뢰성 문제다. “리더보드 게이밍에 취약하다”, “개발사 자체 보고에 의존한다”는 점을 보고서가 직접 지적했다. CAISI도 “많은 선도 모델이 독립 검증 시 자체 보고와 다르게 수행된다”고 밝혔다.
셋째, 한국을 비롯한 아시아 동맹국들의 대응이 빠져 있다. 네이버의 소버린 AI 전략, 카카오의 오픈AI 협력 등 국내 기업들의 선택은 “글로벌 의존성” 논의에 중요한 사례가 될 수 있다.
넷째, 중국 내부 시장 동향이 부재하다. 딥시크 등장 이후 6소룡 스타트업들의 전략 수정, 국유기업의 딥시크 도입 현황 등은 “중국 오픈소스 생태계”의 실제 작동 방식을 이해하는 데 필요한 맥락이다.
결론적으로 “중국이 앞섰다”는 헤드라인보다는 “중국 오픈소스 생태계가 빠르게 성장하고 있으며, 이에 대한 정책적 대응이 필요하다” 정도로 읽는 게 정확하다.






댓글 남기기