メインコンテンツへスキップ

MiniMax-M2.7

MiniMaxMiniMaxOpen WeightMIT · Commercial OK

説明

MiniMax M2.7 features model self-improvement driving productivity innovation. It builds complex agent harnesses independently to accomplish highly complex productivity tasks. M2.7 demonstrates excellent performance in real-world software engineering including end-to-end project delivery, log analysis, code security, and ML tasks. On SWE-Pro it scores 56.22%, nearly matching Opus. It excels in professional office domains achieving the highest ELO among open-source models on GDPval-AA (1495), with significant improvement in complex editing for Office Suite. M2.7 maintains 97% skill adherence on 40 complex skills cases.

リリース日
2026-03-18
パラメータ
コンテキスト長
197K
モダリティ
text

能力レーダー

45
general
43
coding
87
reasoning
61
science推定
50
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools60
54.0
LS
Code Ranking39
75.0
AA
General Ranking25
85.0
AA
Science31
78.0
AA

ベンチマークスコア (LLM Stats)

Agents

GDPval-AA1494.00 / 3000自己申告
MLE-Bench Lite66.6%自己申告
MM-ClawBench62.7%自己申告
Terminal-Bench 2.057.0%自己申告
SWE-Bench Pro56.2%自己申告
VIBE-Pro55.6%自己申告
Toolathlon46.3%自己申告
NL2Repo39.8%自己申告

Code

SWE-bench Multilingual76.5%自己申告
Multi-SWE-Bench52.7%自己申告

General

Artificial Analysis50.0%自己申告

AA評価指数

Intelligence Index
49.6
Coding Index
41.9
Gpqa
0.9
Tau2
0.8
Ifbench
0.8
Lcr
0.7
Scicode
0.5
Terminalbench Hard
0.4
Hle
0.3

LLM Statsカテゴリスコア

Finance
100
General
100
Legal
100
Agents
100
Reasoning
100
Code
60
Tool Calling
50
Coding
40

価格設定

入力価格$0.3 / 1M tokens
出力価格$1.2 / 1M tokens
混合価格(3:1)$0.525 / 1M tokens

速度

トークン/秒48.6 tokens/s
初トークン遅延1.43s
初回答遅延52.07s

利用可能なプロバイダー

(LS内部単位)
プロバイダー入力価格出力価格
MiniMax300K1.2M
Fireworks300K1.2M
Novita300K1.2M

外部リンク