Перейти к основному содержанию

MiMo-V2.5-Pro

Xiaomi

Описание

MiMo-V2.5-Pro is Xiaomi's 1.02T-parameter sparse Mixture-of-Experts language model with 42B active parameters and a 1M-token context window. It inherits the MiMo-V2-Flash hybrid-attention and Multi-Token Prediction design, extends context during pre-training up to 1M tokens, and uses supervised fine-tuning, domain-specialized reinforcement learning, and Multi-Teacher On-Policy Distillation to improve complex software engineering, long-horizon agentic tasks, and ultra-long-context coherence.

Дата выхода
2026-04-22
Параметры
Длина контекста
1.0M
Модальности
text

Радар способностей

40
general
59
coding
87
reasoning
63
scienceоцен.
70
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга25
81.0
AA
Общий рейтинг15
83.0
AA
Наука26
79.0
AA

Оценки бенчмарков (LLM Stats)

Agents

GDPval-AA1286.00 / 3000Сам.
FrontierSWE (Impl.)340.0%Сам.
MiMo Coding Bench73.7%Сам.
TAU3-Bench72.9%Сам.
Terminal-Bench 2.068.4%Сам.
Claw-Eval64.0%Сам.
SWE-Bench Pro57.2%Сам.
WildClawBench43.0%Сам.
Finance Agent v241.5%Сам.

Biology

GPQA66.7%Сам.

Code

SWE-Bench Verified78.9%Сам.

Finance

MMLU89.4%Сам.
MMLU-Pro68.5%Сам.

General

ARC-C97.2%Сам.
MMLU-Redux92.8%Сам.
C-Eval91.5%Сам.
CMMLU90.2%Сам.
Global-MMLU83.6%Сам.
TriviaQA81.3%Сам.
MBPP+74.1%Сам.
LiveCodeBench v639.6%Сам.
SWE-bench Verified (Agentless)35.7%Сам.

Language

BBH88.4%Сам.
Winogrande85.6%Сам.

Long Context

GraphWalks62.0%Сам.

Math

GSM8k99.6%Сам.
DROP86.3%Сам.
MATH86.2%Сам.
AIME37.3%Сам.
Humanity's Last Exam34.0%Сам.

Reasoning

HellaSwag89.8%Сам.
HumanEval+75.6%Сам.

Индексы оценки AA

Coding Index
60.2
Intelligence Index
42.2
Tau2
0.9
Gpqa
0.9
Ifbench
0.8
Lcr
0.7
Terminalbench V2 1
0.7
Scicode
0.5
Terminalbench Hard
0.4
Hle
0.3
Tau Banking
0.1

Оценки категорий LLM Stats

Legal
100
Finance
100
Agents
100
General
100
Reasoning
50
Language
90
Math
80
Frontend Development
80
Healthcare
80
Physics
70
Biology
70
Chemistry
70
Code
70
Tool Calling
70
Long Context
60
Coding
60
Vision
30

Цены

Цена ввода$0.435 / 1M токенов
Цена вывода$0.87 / 1M токенов
Смешанная цена (3:1)$0.544 / 1M токенов
Цена чтения кэша$0.2 / 1M токенов

Скорость

Токенов/сек50.5
Задержка первого токена1.86s
Время до первого ответа41.44s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

3 провайдеров

Самый дешевый: XiaomiСамый дорогой: AIHubMix
ПровайдерВводВывод
1XiaomiОсновной
$0.435
$0.87
2routing.run
$0.45
$1.35
3AIHubMix
$1.1
$3.3

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки