メインコンテンツへスキップ

MiniMax-M2.5

MiniMaxMiniMaxOpen WeightMIT · Commercial OK

説明

MiniMax M2.5 is the world's first production-level model designed natively for Agent scenarios. Building on the M2.1 foundation, M2.5 delivers significant improvements in programming, tool calling, search, and office productivity. With only 10B activation parameters from its 230B MoE architecture, it achieves competitive performance against top international models like Claude Opus 4.6 while maintaining high throughput and efficient inference. M2.5 supports full-stack development for PC, App, and cross-platform applications, and excels in agentic workflows including automated customer support, data-analysis pipelines, and complex task execution.

リリース日
2026-02-12
パラメータ
230.0B
コンテキスト長
197K
モダリティ
image, text

能力レーダー

37
general
38
coding
85
reasoning
57
science推定
70
agents
60
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools27
65.0
LS
Code Ranking68
68.0
AA
General Ranking46
79.0
AA
Science71
67.0
AA

ベンチマークスコア (LLM Stats)

Agents

BrowseComp76.3%自己申告
MEWC74.4%自己申告
SWE-Bench Pro55.4%自己申告
VIBE-Pro54.2%自己申告

Code

SWE-Bench Verified80.2%自己申告
Multi-SWE-Bench51.3%自己申告

Finance

GDPval-MM59.0%自己申告

General

BFCL_v3_MultiTurn76.8%自己申告

AA評価指数

Intelligence Index
41.9
Coding Index
37.4
Tau2
1.0
Gpqa
0.8
Ifbench
0.7
Lcr
0.7
Scicode
0.4
Terminalbench Hard
0.3
Hle
0.2

LLM Statsカテゴリスコア

Frontend Development
80
Search
80
Agents
70
Code
60
Finance
60
General
60
Multimodal
60
Reasoning
60

価格設定

入力価格$0.3 / 1M tokens
出力価格$1.2 / 1M tokens
混合価格(3:1)$0.525 / 1M tokens

速度

トークン/秒84.0 tokens/s
初トークン遅延1.44s
初回答遅延25.25s

利用可能なプロバイダー

(LS内部単位)
プロバイダー入力価格出力価格
MiniMax300K1.2M

外部リンク