MiMo-V2-Omni
XiaomiProprietary
Descripción
MiMo-V2-Omni is Xiaomi's omni foundation model uniting frontier multimodal understanding with strong agentic capability. It fuses dedicated image, video, and audio encoders into a single shared backbone, processing all modalities simultaneously. Natively supports structured tool calling, function execution, and UI grounding. Supports over 10 hours of continuous audio understanding and 256K token context window.
Fecha de lanzamiento
2026-03-19
Parámetros
—
Longitud del contexto
262K
Modalidades
audio, image, text, video
Radar de capacidades
38
general
36
coding
83
reasoning
54
scienceest.
100
agents
85
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Agents & Tools | 61 | 54.0 | LS |
| Code Ranking | 75 | 66.0 | AA |
| General Ranking | 74 | 73.0 | AA |
| Science | 82 | 64.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Agents
GDPval-AA
1410.00 / 3000Aut.
PinchBench
81.2%Aut.
Claw-Eval
54.8%Aut.
MM-BrowserComp
52.0%Aut.
OmniGAIA
49.8%Aut.
Code
SWE-Bench Verified
74.8%Aut.
Índices de evaluación AA
Intelligence Index43.4
Coding Index35.5
Tau20.9
Gpqa0.8
Lcr0.7
Ifbench0.5
Scicode0.4
Terminalbench Hard0.3
Hle0.2
Puntuaciones por categoría LLM Stats
Finance100
General100
Legal100
Reasoning100
Agents100
Code70
Coding70
Frontend Development70
Precios
Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis
Velocidad
Tokens/seg120.9 tokens/s
Retraso del primer token1.35s
Tiempo hasta la respuesta17.89s
Proveedores disponibles
(Unidades internas LS)| Proveedor | Precio de entrada | Precio de salida |
|---|---|---|
| Xiaomi | 400K | 2.0M |