Passer au contenu principal

MiMo-V2.5-Pro

Xiaomi

Description

MiMo-V2.5-Pro is Xiaomi's 1.02T-parameter sparse Mixture-of-Experts language model with 42B active parameters and a 1M-token context window. It inherits the MiMo-V2-Flash hybrid-attention and Multi-Token Prediction design, extends context during pre-training up to 1M tokens, and uses supervised fine-tuning, domain-specialized reinforcement learning, and Multi-Teacher On-Policy Distillation to improve complex software engineering, long-horizon agentic tasks, and ultra-long-context coherence.

Date de sortie
2026-04-22
Paramètres
Longueur du contexte
1.0M
Modalités
text

Radar de capacités

40
general
59
coding
87
reasoning
63
scienceest.
70
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement codage25
81.0
AA
Classement général15
83.0
AA
Science26
79.0
AA

Scores de benchmarks (LLM Stats)

Agents

GDPval-AA1286.00 / 3000Aut.
FrontierSWE (Impl.)340.0%Aut.
MiMo Coding Bench73.7%Aut.
TAU3-Bench72.9%Aut.
Terminal-Bench 2.068.4%Aut.
Claw-Eval64.0%Aut.
SWE-Bench Pro57.2%Aut.
WildClawBench43.0%Aut.
Finance Agent v241.5%Aut.

Biology

GPQA66.7%Aut.

Code

SWE-Bench Verified78.9%Aut.

Finance

MMLU89.4%Aut.
MMLU-Pro68.5%Aut.

General

ARC-C97.2%Aut.
MMLU-Redux92.8%Aut.
C-Eval91.5%Aut.
CMMLU90.2%Aut.
Global-MMLU83.6%Aut.
TriviaQA81.3%Aut.
MBPP+74.1%Aut.
LiveCodeBench v639.6%Aut.
SWE-bench Verified (Agentless)35.7%Aut.

Language

BBH88.4%Aut.
Winogrande85.6%Aut.

Long Context

GraphWalks62.0%Aut.

Math

GSM8k99.6%Aut.
DROP86.3%Aut.
MATH86.2%Aut.
AIME37.3%Aut.
Humanity's Last Exam34.0%Aut.

Reasoning

HellaSwag89.8%Aut.
HumanEval+75.6%Aut.

Indices d'évaluation AA

Coding Index
60.2
Intelligence Index
42.2
Tau2
0.9
Gpqa
0.9
Ifbench
0.8
Lcr
0.7
Terminalbench V2 1
0.7
Scicode
0.5
Terminalbench Hard
0.4
Hle
0.3
Tau Banking
0.1

Scores par catégorie LLM Stats

Legal
100
Finance
100
Agents
100
General
100
Reasoning
50
Language
90
Math
80
Frontend Development
80
Healthcare
80
Physics
70
Biology
70
Chemistry
70
Code
70
Tool Calling
70
Long Context
60
Coding
60
Vision
30

Tarification

Prix d'entrée$0.435 / 1M tokens
Prix de sortie$0.87 / 1M tokens
Prix mixte (3:1)$0.544 / 1M tokens
Prix de lecture cache$0.2 / 1M tokens

Vitesse

Tokens/sec50.5
Délai du premier token1.86s
Temps de réponse41.44s

Classement des Prix par Fournisseur

Classement des Prix par Fournisseur

3 fournisseurs

Moins cher: XiaomiPlus cher: AIHubMix
FournisseurEntréeSortie
1XiaomiPRINCIPAL
$0.435
$0.87
2routing.run
$0.45
$1.35
3AIHubMix
$1.1
$3.3

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes