Перейти к основному содержанию

MiMo-V2-Omni

XiaomiProprietary

Описание

MiMo-V2-Omni is Xiaomi's omni foundation model uniting frontier multimodal understanding with strong agentic capability. It fuses dedicated image, video, and audio encoders into a single shared backbone, processing all modalities simultaneously. Natively supports structured tool calling, function execution, and UI grounding. Supports over 10 hours of continuous audio understanding and 256K token context window.

Дата выхода
2026-03-19
Параметры
Длина контекста
262K
Модальности
audio, image, text, video

Радар способностей

38
general
36
coding
83
reasoning
54
scienceоцен.
100
agents
85
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Agents & Tools61
54.0
LS
Code Ranking75
66.0
AA
General Ranking74
73.0
AA
Science82
64.0
AA

Оценки бенчмарков (LLM Stats)

Agents

GDPval-AA1410.00 / 3000Сам.
PinchBench81.2%Сам.
Claw-Eval54.8%Сам.
MM-BrowserComp52.0%Сам.
OmniGAIA49.8%Сам.

Code

SWE-Bench Verified74.8%Сам.

Индексы оценки AA

Intelligence Index
43.4
Coding Index
35.5
Tau2
0.9
Gpqa
0.8
Lcr
0.7
Ifbench
0.5
Scicode
0.4
Terminalbench Hard
0.3
Hle
0.2

Оценки категорий LLM Stats

Finance
100
General
100
Legal
100
Reasoning
100
Agents
100
Code
70
Coding
70
Frontend Development
70

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек120.9 tokens/s
Задержка первого токена1.35s
Время до первого ответа17.89s

Доступные провайдеры

(Внутренние единицы LS)
ПровайдерЦена вводаЦена вывода
Xiaomi400K2.0M

Внешние ссылки