Qwen3-Coder-Next

5 days ago 4

Qwen3-Coder-Next는 코드 작성 에이전트와 로컬 개발 환경을 위해 설계된 오픈 가중치 언어 모델로, 하이브리드 어텐션과 MoE 구조를 기반으로 함
대규모 실행 가능한 작업 합성과 환경 상호작용, 강화학습을 통해 훈련되어, 낮은 추론 비용으로도 강력한 코딩 및 에이전트 능력을 보유
단순한 파라미터 확장 대신 에이전트 훈련 신호의 확장에 초점을 맞추며, 검증 가능한 코딩 과제와 실행 환경을 활용해 직접 피드백을 학습
SWE-Bench Verified에서 70% 이상을 달성하고, SWE-Bench Pro 및 다국어 환경에서도 대형 모델과 경쟁 가능한 성능을 보임
소형 모델임에도 효율성과 성능의 파레토 균형을 달성해, 비용 효율적인 에이전트 배포에 중요한 의미를 가짐

Qwen3-Coder-Next 개요

Qwen3-Coder-Next는 Qwen3-Next-80B-A3B-Base를 기반으로 한 오픈 가중치 언어 모델
- 하이브리드 어텐션과 Mixture of Experts(MoE) 구조를 채택
- 대규모 실행 가능한 작업 합성, 환경 상호작용, 강화학습을 통해 훈련
목표는 코딩 에이전트와 로컬 개발 환경에서의 효율적 활용
- 낮은 추론 비용으로도 강력한 추론 능력과 코딩 성능을 제공

에이전트 훈련 확장 방식

모델은 파라미터 수 확장보다 에이전트 훈련 신호 확장에 집중
- 검증 가능한 코딩 과제와 실행 가능한 환경을 결합해, 환경 피드백으로부터 직접 학습
주요 훈련 단계
- 코드 및 에이전트 중심 데이터로 지속적 사전학습
- 고품질 에이전트 경로 데이터를 활용한 지도 미세조정
- 소프트웨어 엔지니어링, QA, 웹/UX 등 도메인별 전문 훈련
- 여러 전문가 모델을 단일 배포형 모델로 증류
이러한 접근은 장기 추론, 도구 사용, 실행 실패 복구 능력을 강화

코딩 에이전트 벤치마크 성능

SWE-Bench (Verified, Multilingual, Pro) , TerminalBench 2.0, Aider 등 다양한 벤치마크에서 평가
- SWE-Bench Verified에서 70% 이상 달성
- SWE-Bench Pro 및 다국어 환경에서도 경쟁력 유지
- 작은 활성 파라미터 수에도 불구하고, 더 큰 오픈소스 모델과 동등하거나 우수한 성능
멀티턴 에이전트 작업에서 에이전트 턴 수를 늘릴수록 장기 추론 능력이 강화됨을 확인

효율성과 성능의 균형

Qwen3-Coder-Next (3B active) 는 10~20배 더 큰 모델과 유사한 SWE-Bench-Pro 성능을 달성
전체 어텐션 기반 독점 모델이 절대 성능에서는 앞서지만, Qwen3-Coder-Next는 비용 대비 효율성에서 우수한 파레토 프런티어에 위치
이는 비용 효율적 에이전트 배포에 적합한 모델임을 보여줌

데모 및 적용 예시

소형·고속 코더 모델로 다양한 응용 환경에 통합 가능
- OpenClaw, Qwen Code, Claude Code, Web Dev, Browser Use, Cline 등에서 시연
- coder.qwen.ai를 통해 웹 기반 사용 가능

요약 및 향후 계획

Qwen3-Coder-Next는 코딩 에이전트 벤치마크에서 우수한 속도와 추론 능력을 입증
대형 오픈소스 모델과 비교해도 경쟁력 있는 성능을 보이지만, 여전히 개선 여지가 있음
향후에는 도구 활용 능력, 복잡한 문제 해결, 의사결정 능력을 강화하고
- 더 많은 작업 지원 및 사용자 피드백 기반의 빠른 업데이트를 계획

Read Entire Article