メインコンテンツへスキップ

MiMo-V2.5-TTS

Xiaomi

説明

MiMo-V2.5 is Xiaomi's native omnimodal sparse Mixture-of-Experts model with 310B total parameters, 15B activated parameters, and a 1M-token context window. Built on the MiMo-V2-Flash backbone, it adds dedicated vision and audio encoders for text, image, video, and audio understanding, and is post-trained with SFT, agentic reinforcement learning, and Multi-Teacher On-Policy Distillation for multimodal perception, long-context reasoning, and agentic workflows.

リリース日
2026-04-22
パラメータ
コンテキスト長
1.0M
モダリティ
audio, image, text, video

能力レーダー

80
general
60
coding
70
reasoning
60
science推定
70
agents
88
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
音声35
65.0
AA

ベンチマークスコア (LLM Stats)

Agents

MiMo Coding Bench71.8%自己申告
Terminal-Bench 2.065.8%自己申告
Claw-Eval63.2%自己申告
SWE-Bench Pro56.1%自己申告
Finance Agent v236.7%自己申告
ResearchClawBench16.9%自己申告

Document Understanding

OmniDocBench87.2%自己申告

General

MMMU-Pro77.9%自己申告

Long Context

GraphWalks87.0%自己申告

Multimodal

HR-Bench (4k)88.5%自己申告
Video-MME87.7%自己申告
DailyOmni83.5%自己申告
CharXiv-R81.0%自己申告
VideoHolmes64.0%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Long Context
90
Multimodal
80
General
80
Vision
80
Reasoning
70
Tool Calling
70
Agents
60
Code
60
Coding
60
Finance
40

価格設定

入力価格$0.4 / 1Mトークン
出力価格$2 / 1Mトークン
混合価格(3:1)$0.8 / 1Mトークン
キャッシュ読み取り価格$0.08 / 1Mトークン

速度

速度データがありません

プロバイダー価格ランキング

プロバイダー価格ランキング

1 プロバイダー

プロバイダー入力出力
1Xiaomiプライマリ
$0.4
$2

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク