-
Mistral 3 시리즈는 3B, 8B, 14B의 소형 모델과 41B 활성·675B 총 파라미터를 가진 Mistral Large 3로 구성된 차세대 오픈소스 AI 모델군
- 모든 모델이 Apache 2.0 라이선스로 공개되어, 개발자와 기업이 자유롭게 활용 및 커스터마이징 가능
-
Mistral Large 3는 NVIDIA H200 GPU 3000개로 학습된 Mixture-of-Experts 구조를 채택해, 다국어 대화와 이미지 이해에서 최고 수준 성능 달성
-
Ministral 3는 엣지 환경용으로 설계되어, 비용 대비 성능이 뛰어나며 추론(reasoning) 변형 모델은 AIME ‘25에서 85% 정확도 기록
- Mistral 3는 Mistral AI Studio, Hugging Face, AWS, Azure 등 주요 플랫폼에서 즉시 사용 가능하며, 오픈 AI 생태계 확장을 목표로 함
Mistral 3 개요
- Mistral 3는 Mistral AI의 차세대 모델군으로, 소형 밀집 모델(3B, 8B, 14B)과 대형 희소 모델 Mistral Large 3로 구성
- Mistral Large 3는 41B 활성 파라미터, 675B 총 파라미터를 가진 Mixture-of-Experts(MoE) 구조
- 모든 모델은 Apache 2.0 라이선스로 공개되어 오픈소스 커뮤니티 활용 가능
- 모델은 다양한 압축 포맷으로 제공되어, 분산 지능을 통한 접근성 향상
- Ministral 모델군은 비용 대비 성능비가 가장 우수한 OSS 모델로 평가됨
Mistral Large 3: 오픈 가중치 기반 최상위 모델
- Mistral Large 3는 NVIDIA H200 GPU 3000개로 처음부터 학습된 오픈 가중치 모델
- Mixtral 시리즈 이후 첫 Mixture-of-Experts 모델로, Mistral의 사전학습 기술 발전을 반영
- 학습 후, 일반 프롬프트 성능에서 최고 수준의 오픈 가중치 모델과 동등한 성능을 보이며,
이미지 이해와 비영어권 다국어 대화에서도 우수한 결과 달성
- LMArena 리더보드에서 OSS 비추론(non-reasoning) 모델 2위, 전체 OSS 모델 6위 기록
-
기본(base) 및 지시(instruct) 튜닝 버전이 공개되었으며, 추론(reasoning) 버전은 곧 출시 예정
NVIDIA·vLLM·Red Hat과의 협력
- Mistral Large 3는 vLLM 및 Red Hat과 협력해 오픈소스 커뮤니티에서 쉽게 접근 가능
-
llm-compressor로 제작된 NVFP4 포맷 체크포인트 제공
-
vLLM을 통해 Blackwell NVL72, 8×A100, 8×H100 시스템에서 효율적 실행 가능
- NVIDIA와의 협력으로 TensorRT-LLM, SGLang 등에서 저정밀 추론 지원
-
Blackwell 어텐션 및 MoE 커널, prefill/decode 분리 서빙, 추측 디코딩(speculative decoding) 기능 통합
-
DGX Spark, RTX PC, Jetson 디바이스 등 엣지 환경에서도 최적화된 배포 지원
Ministral 3: 엣지용 지능형 모델
-
엣지 및 로컬 환경을 위한 Ministral 3 시리즈는 3B, 8B, 14B 세 가지 크기로 제공
- 각 모델은 base, instruct, reasoning 세 가지 변형으로 공개
- 모든 변형이 이미지 이해 및 다국어 처리 기능 포함
-
비용 대비 성능비가 가장 높은 OSS 모델로,
instruct 모델은 경쟁 모델과 동등하거나 더 나은 성능을 보이면서 토큰 수를 10분의 1 수준으로 절감
-
reasoning 변형 모델은 정확도 중심 환경에서 강점을 보이며,
14B 모델이 AIME ‘25에서 85% 정확도 달성
배포 및 접근성
- Mistral 3는 다음 플랫폼에서 즉시 사용 가능
-
Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI, Together AI
- 곧 NVIDIA NIM 및 AWS SageMaker에서도 제공 예정
- 기업을 위한 맞춤형 모델 학습 서비스 제공
- 도메인 특화 작업, 독자 데이터셋 성능 향상, 특수 환경 배포 등 지원
Mistral 3의 핵심 가치
-
프런티어 성능과 오픈 접근성: 폐쇄형 모델 수준의 성능을 오픈소스로 제공
-
멀티모달·다국어 지원: 40개 이상 언어에서 텍스트, 이미지, 논리 이해 가능
-
확장 가능한 효율성: 3B~675B 파라미터 범위로, 엣지부터 엔터프라이즈까지 대응
-
적응형 활용성: 코딩, 문서 분석, 도구 활용 등 다양한 워크플로우에 적용 가능
향후 단계
- 모델 문서와 기술 자료는 Mistral Docs 및 AI Governance Hub에서 제공
-
Hugging Face 및 Mistral AI 플랫폼을 통해 즉시 API 사용 가능
-
기업 맞춤형 학습 및 파인튜닝 문의 채널 운영
- 커뮤니티 참여는 Twitter/X, Discord, GitHub에서 가능
결론
- Mistral 3는 투명성, 접근성, 공동 발전을 기반으로 한 오픈 AI 생태계 확장을 목표로 함
-
추론, 효율성, 실사용 응용에서 새로운 가능성을 열며,
“이해를 행동으로 전환” 하는 차세대 오픈 모델로 자리매김