Qwen3-Coder-Next

5 days ago 4

  • Qwen3-Coder-Next는 코드 작성 에이전트와 로컬 개발 환경을 위해 설계된 오픈 가중치 언어 모델로, 하이브리드 어텐션과 MoE 구조를 기반으로 함
  • 대규모 실행 가능한 작업 합성환경 상호작용, 강화학습을 통해 훈련되어, 낮은 추론 비용으로도 강력한 코딩 및 에이전트 능력을 보유
  • 단순한 파라미터 확장 대신 에이전트 훈련 신호의 확장에 초점을 맞추며, 검증 가능한 코딩 과제와 실행 환경을 활용해 직접 피드백을 학습
  • SWE-Bench Verified에서 70% 이상을 달성하고, SWE-Bench Pro 및 다국어 환경에서도 대형 모델과 경쟁 가능한 성능을 보임
  • 소형 모델임에도 효율성과 성능의 파레토 균형을 달성해, 비용 효율적인 에이전트 배포에 중요한 의미를 가짐

Qwen3-Coder-Next 개요

  • Qwen3-Coder-NextQwen3-Next-80B-A3B-Base를 기반으로 한 오픈 가중치 언어 모델
    • 하이브리드 어텐션과 Mixture of Experts(MoE) 구조를 채택
    • 대규모 실행 가능한 작업 합성, 환경 상호작용, 강화학습을 통해 훈련
  • 목표는 코딩 에이전트로컬 개발 환경에서의 효율적 활용
    • 낮은 추론 비용으로도 강력한 추론 능력코딩 성능을 제공

에이전트 훈련 확장 방식

  • 모델은 파라미터 수 확장보다 에이전트 훈련 신호 확장에 집중
    • 검증 가능한 코딩 과제와 실행 가능한 환경을 결합해, 환경 피드백으로부터 직접 학습
  • 주요 훈련 단계
    • 코드 및 에이전트 중심 데이터로 지속적 사전학습
    • 고품질 에이전트 경로 데이터를 활용한 지도 미세조정
    • 소프트웨어 엔지니어링, QA, 웹/UX 등 도메인별 전문 훈련
    • 여러 전문가 모델을 단일 배포형 모델로 증류
  • 이러한 접근은 장기 추론, 도구 사용, 실행 실패 복구 능력을 강화

코딩 에이전트 벤치마크 성능

  • SWE-Bench (Verified, Multilingual, Pro) , TerminalBench 2.0, Aider 등 다양한 벤치마크에서 평가
    • SWE-Bench Verified에서 70% 이상 달성
    • SWE-Bench Pro 및 다국어 환경에서도 경쟁력 유지
    • 작은 활성 파라미터 수에도 불구하고, 더 큰 오픈소스 모델과 동등하거나 우수한 성능
  • 멀티턴 에이전트 작업에서 에이전트 턴 수를 늘릴수록 장기 추론 능력이 강화됨을 확인

효율성과 성능의 균형

  • Qwen3-Coder-Next (3B active)10~20배 더 큰 모델과 유사한 SWE-Bench-Pro 성능을 달성
  • 전체 어텐션 기반 독점 모델이 절대 성능에서는 앞서지만, Qwen3-Coder-Next는 비용 대비 효율성에서 우수한 파레토 프런티어에 위치
  • 이는 비용 효율적 에이전트 배포에 적합한 모델임을 보여줌

데모 및 적용 예시

  • 소형·고속 코더 모델로 다양한 응용 환경에 통합 가능
    • OpenClaw, Qwen Code, Claude Code, Web Dev, Browser Use, Cline 등에서 시연
    • coder.qwen.ai를 통해 웹 기반 사용 가능

요약 및 향후 계획

  • Qwen3-Coder-Next는 코딩 에이전트 벤치마크에서 우수한 속도와 추론 능력을 입증
  • 대형 오픈소스 모델과 비교해도 경쟁력 있는 성능을 보이지만, 여전히 개선 여지가 있음
  • 향후에는 도구 활용 능력, 복잡한 문제 해결, 의사결정 능력을 강화하고
    • 더 많은 작업 지원 및 사용자 피드백 기반의 빠른 업데이트를 계획

Read Entire Article