MiMo-V2-Omni
XiaomiProprietary
Description
MiMo-V2-Omni is Xiaomi's omni foundation model uniting frontier multimodal understanding with strong agentic capability. It fuses dedicated image, video, and audio encoders into a single shared backbone, processing all modalities simultaneously. Natively supports structured tool calling, function execution, and UI grounding. Supports over 10 hours of continuous audio understanding and 256K token context window.
Date de sortie
2026-03-19
Paramètres
—
Longueur du contexte
262K
Modalités
audio, image, text, video
Radar de capacités
38
general
36
coding
83
reasoning
54
scienceest.
100
agents
85
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Agents & Tools | 61 | 54.0 | LS |
| Code Ranking | 75 | 66.0 | AA |
| General Ranking | 74 | 73.0 | AA |
| Science | 82 | 64.0 | AA |
Scores de benchmarks (LLM Stats)
Agents
GDPval-AA
1410.00 / 3000Aut.
PinchBench
81.2%Aut.
Claw-Eval
54.8%Aut.
MM-BrowserComp
52.0%Aut.
OmniGAIA
49.8%Aut.
Code
SWE-Bench Verified
74.8%Aut.
Indices d'évaluation AA
Intelligence Index43.4
Coding Index35.5
Tau20.9
Gpqa0.8
Lcr0.7
Ifbench0.5
Scicode0.4
Terminalbench Hard0.3
Hle0.2
Scores par catégorie LLM Stats
Finance100
General100
Legal100
Reasoning100
Agents100
Code70
Coding70
Frontend Development70
Tarification
Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit
Vitesse
Tokens/sec120.9 tokens/s
Délai du premier token1.35s
Temps de réponse17.89s
Fournisseurs disponibles
(Unités internes LS)| Fournisseur | Prix d'entrée | Prix de sortie |
|---|---|---|
| Xiaomi | 400K | 2.0M |