Saltar al contenido principal

MiMo-V2-Omni

XiaomiProprietary

Descripción

MiMo-V2-Omni is Xiaomi's omni foundation model uniting frontier multimodal understanding with strong agentic capability. It fuses dedicated image, video, and audio encoders into a single shared backbone, processing all modalities simultaneously. Natively supports structured tool calling, function execution, and UI grounding. Supports over 10 hours of continuous audio understanding and 256K token context window.

Fecha de lanzamiento
2026-03-19
Parámetros
Longitud del contexto
262K
Modalidades
audio, image, pdf, text, video

Radar de capacidades

32
general
37
coding
83
reasoning
54
scienceest.
100
agents
85
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Capacidad agéntica66
54.0
LS
Ranking de codificación73
72.0
AA
Ranking general91
67.0
AA
Ciencia101
61.0
AA

Puntuaciones de benchmarks (LLM Stats)

Agents

GDPval-AA1410.00 / 3000Aut.
PinchBench81.2%Aut.
Claw-Eval54.8%Aut.
MM-BrowserComp52.0%Aut.
OmniGAIA49.8%Aut.

Code

SWE-Bench Verified74.8%Aut.

Índices de evaluación AA

Intelligence Index
35.0
Tau2
0.9
Gpqa
0.8
Lcr
0.7
Ifbench
0.5
Scicode
0.4
Terminalbench Hard
0.3
Hle
0.2

Puntuaciones por categoría LLM Stats

Legal
100
Finance
100
General
100
Reasoning
100
Agents
100
Frontend Development
70
Code
70
Coding
70

Precios

Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis
Precio de lectura caché$0.08 / 1M tokens

Velocidad

Tokens/seg70.9
Retraso del primer token2.79s
Tiempo hasta la respuesta31.00s

Ranking de Precios por Proveedor

Ranking de Precios por Proveedor

6 proveedores

Más barato: NanoGPTMás caro: Xiaomi
ProveedorEntradaSalida
1NanoGPTMás barato
$0.4
$2
2OpenCode Go
$0.4
$2
3ZenMux
$0.4
$2
4Kilo Gateway
$0.4
$2
5LLM Gateway
$0.4
$2
6Xiaomi
$0.4
$2

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas