MiMo-V2-Omni

XiaomiProprietary

Description

MiMo-V2-Omni is Xiaomi's omni foundation model uniting frontier multimodal understanding with strong agentic capability. It fuses dedicated image, video, and audio encoders into a single shared backbone, processing all modalities simultaneously. Natively supports structured tool calling, function execution, and UI grounding. Supports over 10 hours of continuous audio understanding and 256K token context window.

Date de sortie

2026-03-19

Paramètres

—

Longueur du contexte

262K

Modalités

audio, image, pdf, text, video

Radar de capacités

general

coding

reasoning

scienceest.

100

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Capacité agentique	66	54.0	LS
Classement codage	73	72.0	AA
Classement général	91	67.0	AA
Science	101	61.0	AA

Scores de benchmarks (LLM Stats)

Agents

GDPval-AA

1410.00 / 3000Aut.

PinchBench

81.2%Aut.

Claw-Eval

54.8%Aut.

MM-BrowserComp

52.0%Aut.

OmniGAIA

49.8%Aut.

Code

SWE-Bench Verified

74.8%Aut.

Indices d'évaluation AA

Intelligence Index

35.0

Tau2

0.9

Gpqa

0.8

Lcr

0.7

Ifbench

0.5

Scicode

0.4

Terminalbench Hard

0.3

Hle

0.2

Scores par catégorie LLM Stats

Legal

100

Finance

100

General

100

Reasoning

100

Agents

100

Frontend Development

Code

Coding

Tarification

Prix d'entréeGratuit

Prix de sortieGratuit

Prix mixte (3:1)Gratuit

Prix de lecture cache$0.08 / 1M tokens

Vitesse

Tokens/sec70.9

Délai du premier token2.79s

Temps de réponse31.00s

Classement des Prix par Fournisseur

6 fournisseurs

Moins cher: NanoGPTPlus cher: Xiaomi

FournisseurEntréeSortie

1NanoGPTMoins cher

$0.4

2OpenCode Go

$0.4

3ZenMux

$0.4

4Kilo Gateway

$0.4

5LLM Gateway

$0.4

6Xiaomi

$0.4

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

LLM Stats Artificial Analysis