MiMo-V2-Omni

XiaomiProprietary

Descripción

MiMo-V2-Omni is Xiaomi's omni foundation model uniting frontier multimodal understanding with strong agentic capability. It fuses dedicated image, video, and audio encoders into a single shared backbone, processing all modalities simultaneously. Natively supports structured tool calling, function execution, and UI grounding. Supports over 10 hours of continuous audio understanding and 256K token context window.

Fecha de lanzamiento

2026-03-19

Parámetros

—

Longitud del contexto

262K

Modalidades

audio, image, pdf, text, video

Radar de capacidades

general

coding

reasoning

scienceest.

100

agents

multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio	#Posición	Puntuación	Fuente
Capacidad agéntica	66	54.0	LS
Ranking de codificación	73	72.0	AA
Ranking general	91	67.0	AA
Ciencia	101	61.0	AA

Puntuaciones de benchmarks (LLM Stats)

Agents

GDPval-AA

1410.00 / 3000Aut.

PinchBench

81.2%Aut.

Claw-Eval

54.8%Aut.

MM-BrowserComp

52.0%Aut.

OmniGAIA

49.8%Aut.

Code

SWE-Bench Verified

74.8%Aut.

Índices de evaluación AA

Intelligence Index

35.0

Tau2

0.9

Gpqa

0.8

Lcr

0.7

Ifbench

0.5

Scicode

0.4

Terminalbench Hard

0.3

Hle

0.2

Puntuaciones por categoría LLM Stats

Legal

100

Finance

100

General

100

Reasoning

100

Agents

100

Frontend Development

Code

Coding

Precios

Precio de entradaGratis

Precio de salidaGratis

Precio mixto (3:1)Gratis

Precio de lectura caché$0.08 / 1M tokens

Velocidad

Tokens/seg70.9

Retraso del primer token2.79s

Tiempo hasta la respuesta31.00s

Ranking de Precios por Proveedor

6 proveedores

Más barato: NanoGPTMás caro: Xiaomi

ProveedorEntradaSalida

1NanoGPTMás barato

$0.4

2OpenCode Go

$0.4

3ZenMux

$0.4

4Kilo Gateway

$0.4

5LLM Gateway

$0.4

6Xiaomi

$0.4

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas

LLM Stats Artificial Analysis