MiniMax-M2.7
MiniMaxMiniMaxOpen WeightMIT · Commercial OK
説明
MiniMax M2.7 features model self-improvement driving productivity innovation. It builds complex agent harnesses independently to accomplish highly complex productivity tasks. M2.7 demonstrates excellent performance in real-world software engineering including end-to-end project delivery, log analysis, code security, and ML tasks. On SWE-Pro it scores 56.22%, nearly matching Opus. It excels in professional office domains achieving the highest ELO among open-source models on GDPval-AA (1495), with significant improvement in complex editing for Office Suite. M2.7 maintains 97% skill adherence on 40 complex skills cases.
リリース日
2026-03-18
パラメータ
—
コンテキスト長
197K
モダリティ
text
能力レーダー
45
general
43
coding
87
reasoning
61
science推定
50
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 60 | 54.0 | LS |
| Code Ranking | 39 | 75.0 | AA |
| General Ranking | 25 | 85.0 | AA |
| Science | 31 | 78.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
GDPval-AA
1494.00 / 3000自己申告
MLE-Bench Lite
66.6%自己申告
MM-ClawBench
62.7%自己申告
Terminal-Bench 2.0
57.0%自己申告
SWE-Bench Pro
56.2%自己申告
VIBE-Pro
55.6%自己申告
Toolathlon
46.3%自己申告
NL2Repo
39.8%自己申告
Code
SWE-bench Multilingual
76.5%自己申告
Multi-SWE-Bench
52.7%自己申告
General
Artificial Analysis
50.0%自己申告
AA評価指数
Intelligence Index49.6
Coding Index41.9
Gpqa0.9
Tau20.8
Ifbench0.8
Lcr0.7
Scicode0.5
Terminalbench Hard0.4
Hle0.3
LLM Statsカテゴリスコア
Finance100
General100
Legal100
Agents100
Reasoning100
Code60
Tool Calling50
Coding40
価格設定
入力価格$0.3 / 1M tokens
出力価格$1.2 / 1M tokens
混合価格(3:1)$0.525 / 1M tokens
速度
トークン/秒48.6 tokens/s
初トークン遅延1.43s
初回答遅延52.07s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| MiniMax | 300K | 1.2M |
| Fireworks | 300K | 1.2M |
| Novita | 300K | 1.2M |