मुख्य सामग्री पर जाएं

MiMo-V2-Omni

XiaomiProprietary

विवरण

MiMo-V2-Omni is Xiaomi's omni foundation model uniting frontier multimodal understanding with strong agentic capability. It fuses dedicated image, video, and audio encoders into a single shared backbone, processing all modalities simultaneously. Natively supports structured tool calling, function execution, and UI grounding. Supports over 10 hours of continuous audio understanding and 256K token context window.

रिलीज़ तिथि
2026-03-19
पैरामीटर
संदर्भ लंबाई
262K
मोडैलिटीज़
audio, image, text, video

क्षमता रडार

38
general
36
coding
83
reasoning
54
scienceअनुमानित
100
agents
85
multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन#रैंकस्कोरस्रोत
Agents & Tools61
54.0
LS
Code Ranking75
66.0
AA
General Ranking74
73.0
AA
Science82
64.0
AA

बेंचमार्क स्कोर (LLM Stats)

Agents

GDPval-AA1410.00 / 3000स्वयं
PinchBench81.2%स्वयं
Claw-Eval54.8%स्वयं
MM-BrowserComp52.0%स्वयं
OmniGAIA49.8%स्वयं

Code

SWE-Bench Verified74.8%स्वयं

AA मूल्यांकन सूचकांक

Intelligence Index
43.4
Coding Index
35.5
Tau2
0.9
Gpqa
0.8
Lcr
0.7
Ifbench
0.5
Scicode
0.4
Terminalbench Hard
0.3
Hle
0.2

LLM Stats श्रेणी स्कोर

Finance
100
General
100
Legal
100
Reasoning
100
Agents
100
Code
70
Coding
70
Frontend Development
70

मूल्य निर्धारण

इनपुट मूल्यमुफ्त
आउटपुट मूल्यमुफ्त
मिश्रित मूल्य (3:1)मुफ्त

गति

टोकन/सेकंड120.9 tokens/s
पहले टोकन में देरी1.35s
पहले उत्तर में देरी17.89s

उपलब्ध प्रदाता

(LS आंतरिक इकाइयाँ)
प्रदाताइनपुट मूल्यआउटपुट मूल्य
Xiaomi400K2.0M

बाहरी लिंक