メインコンテンツへスキップ

MiMo-V2-Omni

XiaomiProprietary

説明

MiMo-V2-Omni is Xiaomi's omni foundation model uniting frontier multimodal understanding with strong agentic capability. It fuses dedicated image, video, and audio encoders into a single shared backbone, processing all modalities simultaneously. Natively supports structured tool calling, function execution, and UI grounding. Supports over 10 hours of continuous audio understanding and 256K token context window.

リリース日
2026-03-19
パラメータ
コンテキスト長
262K
モダリティ
audio, image, text, video

能力レーダー

38
general
36
coding
83
reasoning
54
science推定
100
agents
85
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools61
54.0
LS
Code Ranking75
66.0
AA
General Ranking74
73.0
AA
Science82
64.0
AA

ベンチマークスコア (LLM Stats)

Agents

GDPval-AA1410.00 / 3000自己申告
PinchBench81.2%自己申告
Claw-Eval54.8%自己申告
MM-BrowserComp52.0%自己申告
OmniGAIA49.8%自己申告

Code

SWE-Bench Verified74.8%自己申告

AA評価指数

Intelligence Index
43.4
Coding Index
35.5
Tau2
0.9
Gpqa
0.8
Lcr
0.7
Ifbench
0.5
Scicode
0.4
Terminalbench Hard
0.3
Hle
0.2

LLM Statsカテゴリスコア

Finance
100
General
100
Legal
100
Reasoning
100
Agents
100
Code
70
Coding
70
Frontend Development
70

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料

速度

トークン/秒120.9 tokens/s
初トークン遅延1.35s
初回答遅延17.89s

利用可能なプロバイダー

(LS内部単位)
プロバイダー入力価格出力価格
Xiaomi400K2.0M

外部リンク