跳轉到主要內容

MiMo-V2.5-Pro

Xiaomi開源權重MIT · 商用許可

描述

MiMo-V2.5-Pro is Xiaomi's 1.02T-parameter sparse Mixture-of-Experts language model with 42B active parameters and a 1M-token context window. It inherits the MiMo-V2-Flash hybrid-attention and Multi-Token Prediction design, extends context during pre-training up to 1M tokens, and uses supervised fine-tuning, domain-specialized reinforcement learning, and Multi-Teacher On-Policy Distillation to improve complex software engineering, long-horizon agentic tasks, and ultra-long-context coherence.

發布日期
2026-04-27
參數規模
1.0T
上下文長度
1.0M
支援模態
text

能力雷達圖

100
general
70
coding
80
reasoning
60
science估算
70
agents
0
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域#排名分數來源
智慧體能力模型榜29
65.0
LS
推理能力23
83.0
LS

基準測試分數 (LLM Stats)

Agents

GDPval-AA1581.00 / 3000自報
FrontierSWE (Impl.)340.0%自報
MiMo Coding Bench73.7%自報
TAU3-Bench72.9%自報
Terminal-Bench 2.068.4%自報
Claw-Eval64.0%自報
SWE-Bench Pro57.2%自報
WildClawBench43.0%自報

Biology

GPQA66.7%自報

Code

SWE-Bench Verified78.9%自報

Finance

MMLU89.4%自報
MMLU-Pro68.5%自報

General

ARC-C97.2%自報
MMLU-Redux92.8%自報
C-Eval91.5%自報
CMMLU90.2%自報
Global-MMLU83.6%自報
TriviaQA81.3%自報
MBPP+74.1%自報
LiveCodeBench v639.6%自報
SWE-bench Verified (Agentless)35.7%自報

Language

BBH88.4%自報
Winogrande85.6%自報

Long Context

GraphWalks62.0%自報

Math

GSM8k99.6%自報
DROP86.3%自報
MATH86.2%自報
AIME37.3%自報
Humanity's Last Exam34.0%自報

Reasoning

HellaSwag89.8%自報
HumanEval+75.6%自報

AA 評測指數

暫無 AA 評測資料

LLM Stats 分類評分

Finance
100
Legal
100
Agents
100
General
100
Reasoning
64
Language
90
Frontend Development
80
Healthcare
80
Math
80
Tool Calling
70
Physics
70
Biology
70
Chemistry
70
Code
70
Long Context
60
Coding
60
Vision
30

定價

輸入價格$0 / 1M tokens
輸出價格$0 / 1M tokens
混合價格(3:1)$0 / 1M tokens
快取讀取價格$0.2 / 1M tokens

速度

暫無速度資料

供應商價格排行

供應商價格排行

6 個供應商

最便宜: Xiaomi最貴: OpenCode Go
供應商輸入輸出
1Xiaomi主要
$0
$0
2DeepInfra
$0
$0
3Novita
$0
$0.00001
4CrofAI
$0.4
$0.8
5LLM Gateway
$1
$3
6OpenCode Go
$1.74
$3.48

比較該模型在不同 API 供應商之間的定價。

外部連結