글로벌

알리바바, 에이전틱 AI 코딩 모델 ‘Qwen3-Coder’ 오픈소스 공개

알리바바가 에이전틱 AI 코딩 모델 ‘Qwen3-Coder’를 공개했다. 이 모델은 새로운 코드 생성부터 복잡한 코딩 워크플로우 관리, 전체 코드베이스 디버깅까지 다양한 에이전틱 AI 코딩 작업에 특화되어 개발됐다.

Qwen3-Coder-480B-A35B-Instruct는 MoE(Mixture-of-Experts) 아키텍처를 기반으로 한 오픈소스 모델이다. 총 4,800억 개의 파라미터 중 토큰당 350억 개의 파라미터를 활성화하는 방식으로 효율성을 높였다. 이 모델은 에이전틱 코딩, 브라우저 사용, 툴 사용 등 주요 벤치마크에서 기존 SOTA(state-of-the-art) 모델들과 비교할 만한 성과를 기록했다고 알리바바 측은 설명했다.

알리바바는 이와 함께 개발자가 자연어로 엔지니어링 작업을 AI에 위임할 수 있는 명령줄 인터페이스(CLI) 도구인 ‘Qwen Code’도 오픈소스로 공개했다. 이 도구는 맞춤형 프롬프트와 상호작용 프로토콜로 구성되어 Qwen3-Coder의 에이전틱 프로그래밍 기능을 지원한다. 클로드 코드(Claude Code) 인터페이스와의 연동도 지원해 개발자들의 접근성을 높였다.

Qwen3-Coder는 광범위한 코드 및 일반 텍스트 데이터로 학습되었다. 기본적으로 25만6천 토큰의 컨텍스트 윈도우를 지원하며, 최대 100만 토큰까지 확장 가능해 대규모 코드베이스를 단일 세션에서 처리할 수 있다고 회사 측은 밝혔다.

모델 개발 과정에서는 학습 단계에서 토큰 수, 컨텍스트 길이, 합성 데이터 규모를 확장하는 한편, 후속 학습 과정에서 장기 강화학습(agent RL) 기법을 적용했다. 이를 통해 모델이 외부 도구와의 다단계 상호작용을 통해 복잡한 실제 문제를 해결할 수 있게 되었다고 알리바바는 설명했다.

그 결과 Qwen3-Coder는 실제 소프트웨어 문제 해결 능력을 평가하는 벤치마크인 SWE-벤치 베리파이드(SWE-Bench Verified)에서 테스트 타임이나 추론 확장 없이도 오픈소스 모델 중 SOTA 성능을 달성했다고 회사 측은 발표했다.

Qwen3-Coder-480B-A35B-Instruct 모델은 현재 허깅 페이스(Hugging Face)와 깃허브(GitHub)에서 이용할 수 있다. 개발자들은 Qwen 챗(Qwen Chat)이나 알리바바의 생성형 AI 개발 플랫폼인 모델 스튜디오(Model Studio)를 통해 API로 모델을 활용할 수 있다.

Qwen 기반 코딩 모델은 전 세계적으로 누적 2천만 건 이상 다운로드되었다고 알리바바는 밝혔다. 알리바바 클라우드의 코딩 어시스턴트인 ‘통이 링마(Tongyi Lingma)’는 향후 Qwen3-Coder의 에이전틱 기능을 탑재해 업그레이드될 예정이다. 2024년 6월 출시된 통이 링마의 ‘AI 프로그래머(AI Programmer)’ 기능은 현재까지 30억 줄 이상의 코드를 생성했다고 회사 측은 전했다.

플래텀 중국 연구소장 / 편견 없는 시각으로 중국의 정치·경제·사회 현상을 관찰하고, 객관적인 분석을 통해 현지 상황을 이해하려 노력합니다.

댓글

Leave a Comment


관련 기사

글로벌

알리바바, 세계 최초 MoE 기반 영상 생성 모델 ‘Wan2.2’ 오픈소스 공개

글로벌

알리바바 클라우드, 싱가포르 AI 센터 설립으로 글로벌 주도권 확보 나서

글로벌

[중국 비즈니스 트렌드&동향] 샤오미 전기 SUV, 출시 1시간 만에 28만 대 예약 돌파

글로벌

중국 즉시배송 전쟁, 누가 웃을 것인가