Mistral 3 모델 제품군 공개

1 week ago 3

Mistral 3 시리즈는 3B, 8B, 14B의 소형 모델과 41B 활성·675B 총 파라미터를 가진 Mistral Large 3로 구성된 차세대 오픈소스 AI 모델군
모든 모델이 Apache 2.0 라이선스로 공개되어, 개발자와 기업이 자유롭게 활용 및 커스터마이징 가능
Mistral Large 3는 NVIDIA H200 GPU 3000개로 학습된 Mixture-of-Experts 구조를 채택해, 다국어 대화와 이미지 이해에서 최고 수준 성능 달성
Ministral 3는 엣지 환경용으로 설계되어, 비용 대비 성능이 뛰어나며 추론(reasoning) 변형 모델은 AIME ‘25에서 85% 정확도 기록
Mistral 3는 Mistral AI Studio, Hugging Face, AWS, Azure 등 주요 플랫폼에서 즉시 사용 가능하며, 오픈 AI 생태계 확장을 목표로 함

Mistral 3 개요

Mistral 3는 Mistral AI의 차세대 모델군으로, 소형 밀집 모델(3B, 8B, 14B)과 대형 희소 모델 Mistral Large 3로 구성
- Mistral Large 3는 41B 활성 파라미터, 675B 총 파라미터를 가진 Mixture-of-Experts(MoE) 구조
- 모든 모델은 Apache 2.0 라이선스로 공개되어 오픈소스 커뮤니티 활용 가능
모델은 다양한 압축 포맷으로 제공되어, 분산 지능을 통한 접근성 향상
Ministral 모델군은 비용 대비 성능비가 가장 우수한 OSS 모델로 평가됨

Mistral Large 3는 NVIDIA H200 GPU 3000개로 처음부터 학습된 오픈 가중치 모델
- Mixtral 시리즈 이후 첫 Mixture-of-Experts 모델로, Mistral의 사전학습 기술 발전을 반영
학습 후, 일반 프롬프트 성능에서 최고 수준의 오픈 가중치 모델과 동등한 성능을 보이며,
이미지 이해와 비영어권 다국어 대화에서도 우수한 결과 달성
LMArena 리더보드에서 OSS 비추론(non-reasoning) 모델 2위, 전체 OSS 모델 6위 기록
기본(base) 및 지시(instruct) 튜닝 버전이 공개되었으며, 추론(reasoning) 버전은 곧 출시 예정

Mistral Large 3는 vLLM 및 Red Hat과 협력해 오픈소스 커뮤니티에서 쉽게 접근 가능
- llm-compressor로 제작된 NVFP4 포맷 체크포인트 제공
- vLLM을 통해 Blackwell NVL72, 8×A100, 8×H100 시스템에서 효율적 실행 가능
NVIDIA와의 협력으로 TensorRT-LLM, SGLang 등에서 저정밀 추론 지원
- Blackwell 어텐션 및 MoE 커널, prefill/decode 분리 서빙, 추측 디코딩(speculative decoding) 기능 통합
DGX Spark, RTX PC, Jetson 디바이스 등 엣지 환경에서도 최적화된 배포 지원

엣지 및 로컬 환경을 위한 Ministral 3 시리즈는 3B, 8B, 14B 세 가지 크기로 제공
- 각 모델은 base, instruct, reasoning 세 가지 변형으로 공개
- 모든 변형이 이미지 이해 및 다국어 처리 기능 포함
비용 대비 성능비가 가장 높은 OSS 모델로,
instruct 모델은 경쟁 모델과 동등하거나 더 나은 성능을 보이면서 토큰 수를 10분의 1 수준으로 절감
reasoning 변형 모델은 정확도 중심 환경에서 강점을 보이며,
14B 모델이 AIME ‘25에서 85% 정확도 달성

Mistral 3는 다음 플랫폼에서 즉시 사용 가능
- Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI, Together AI
- 곧 NVIDIA NIM 및 AWS SageMaker에서도 제공 예정
기업을 위한 맞춤형 모델 학습 서비스 제공
- 도메인 특화 작업, 독자 데이터셋 성능 향상, 특수 환경 배포 등 지원