-
Qwen3-Coder-Next는 코드 작성 에이전트와 로컬 개발 환경을 위해 설계된 오픈 가중치 언어 모델로, 하이브리드 어텐션과 MoE 구조를 기반으로 함
- 대규모 실행 가능한 작업 합성과 환경 상호작용, 강화학습을 통해 훈련되어, 낮은 추론 비용으로도 강력한 코딩 및 에이전트 능력을 보유
- 단순한 파라미터 확장 대신 에이전트 훈련 신호의 확장에 초점을 맞추며, 검증 가능한 코딩 과제와 실행 환경을 활용해 직접 피드백을 학습
-
SWE-Bench Verified에서 70% 이상을 달성하고, SWE-Bench Pro 및 다국어 환경에서도 대형 모델과 경쟁 가능한 성능을 보임
- 소형 모델임에도 효율성과 성능의 파레토 균형을 달성해, 비용 효율적인 에이전트 배포에 중요한 의미를 가짐
Qwen3-Coder-Next 개요
-
Qwen3-Coder-Next는 Qwen3-Next-80B-A3B-Base를 기반으로 한 오픈 가중치 언어 모델
- 하이브리드 어텐션과 Mixture of Experts(MoE) 구조를 채택
- 대규모 실행 가능한 작업 합성, 환경 상호작용, 강화학습을 통해 훈련
- 목표는 코딩 에이전트와 로컬 개발 환경에서의 효율적 활용
- 낮은 추론 비용으로도 강력한 추론 능력과 코딩 성능을 제공
에이전트 훈련 확장 방식
- 모델은 파라미터 수 확장보다 에이전트 훈련 신호 확장에 집중
- 검증 가능한 코딩 과제와 실행 가능한 환경을 결합해, 환경 피드백으로부터 직접 학습
- 주요 훈련 단계
- 코드 및 에이전트 중심 데이터로 지속적 사전학습
- 고품질 에이전트 경로 데이터를 활용한 지도 미세조정
-
소프트웨어 엔지니어링, QA, 웹/UX 등 도메인별 전문 훈련
- 여러 전문가 모델을 단일 배포형 모델로 증류
- 이러한 접근은 장기 추론, 도구 사용, 실행 실패 복구 능력을 강화
코딩 에이전트 벤치마크 성능
-
SWE-Bench (Verified, Multilingual, Pro) , TerminalBench 2.0, Aider 등 다양한 벤치마크에서 평가
-
SWE-Bench Verified에서 70% 이상 달성
-
SWE-Bench Pro 및 다국어 환경에서도 경쟁력 유지
- 작은 활성 파라미터 수에도 불구하고, 더 큰 오픈소스 모델과 동등하거나 우수한 성능
-
멀티턴 에이전트 작업에서 에이전트 턴 수를 늘릴수록 장기 추론 능력이 강화됨을 확인
효율성과 성능의 균형
-
Qwen3-Coder-Next (3B active) 는 10~20배 더 큰 모델과 유사한 SWE-Bench-Pro 성능을 달성
-
전체 어텐션 기반 독점 모델이 절대 성능에서는 앞서지만, Qwen3-Coder-Next는 비용 대비 효율성에서 우수한 파레토 프런티어에 위치
- 이는 비용 효율적 에이전트 배포에 적합한 모델임을 보여줌
데모 및 적용 예시
- 소형·고속 코더 모델로 다양한 응용 환경에 통합 가능
-
OpenClaw, Qwen Code, Claude Code, Web Dev, Browser Use, Cline 등에서 시연
-
coder.qwen.ai를 통해 웹 기반 사용 가능
요약 및 향후 계획
- Qwen3-Coder-Next는 코딩 에이전트 벤치마크에서 우수한 속도와 추론 능력을 입증
- 대형 오픈소스 모델과 비교해도 경쟁력 있는 성능을 보이지만, 여전히 개선 여지가 있음
- 향후에는 도구 활용 능력, 복잡한 문제 해결, 의사결정 능력을 강화하고
- 더 많은 작업 지원 및 사용자 피드백 기반의 빠른 업데이트를 계획