मुख्य सामग्री पर जाएं

MiniMax-M2.7

MiniMaxMiniMaxOpen WeightMIT · Commercial OK

विवरण

MiniMax M2.7 features model self-improvement driving productivity innovation. It builds complex agent harnesses independently to accomplish highly complex productivity tasks. M2.7 demonstrates excellent performance in real-world software engineering including end-to-end project delivery, log analysis, code security, and ML tasks. On SWE-Pro it scores 56.22%, nearly matching Opus. It excels in professional office domains achieving the highest ELO among open-source models on GDPval-AA (1495), with significant improvement in complex editing for Office Suite. M2.7 maintains 97% skill adherence on 40 complex skills cases.

रिलीज़ तिथि
2026-03-18
पैरामीटर
संदर्भ लंबाई
197K
मोडैलिटीज़
text

क्षमता रडार

45
general
43
coding
87
reasoning
61
scienceअनुमानित
50
agents
0
multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन#रैंकस्कोरस्रोत
Agents & Tools60
54.0
LS
Code Ranking39
75.0
AA
General Ranking25
85.0
AA
Science31
78.0
AA

बेंचमार्क स्कोर (LLM Stats)

Agents

GDPval-AA1494.00 / 3000स्वयं
MLE-Bench Lite66.6%स्वयं
MM-ClawBench62.7%स्वयं
Terminal-Bench 2.057.0%स्वयं
SWE-Bench Pro56.2%स्वयं
VIBE-Pro55.6%स्वयं
Toolathlon46.3%स्वयं
NL2Repo39.8%स्वयं

Code

SWE-bench Multilingual76.5%स्वयं
Multi-SWE-Bench52.7%स्वयं

General

Artificial Analysis50.0%स्वयं

AA मूल्यांकन सूचकांक

Intelligence Index
49.6
Coding Index
41.9
Gpqa
0.9
Tau2
0.8
Ifbench
0.8
Lcr
0.7
Scicode
0.5
Terminalbench Hard
0.4
Hle
0.3

LLM Stats श्रेणी स्कोर

Finance
100
General
100
Legal
100
Agents
100
Reasoning
100
Code
60
Tool Calling
50
Coding
40

मूल्य निर्धारण

इनपुट मूल्य$0.3 / 1M tokens
आउटपुट मूल्य$1.2 / 1M tokens
मिश्रित मूल्य (3:1)$0.525 / 1M tokens

गति

टोकन/सेकंड48.6 tokens/s
पहले टोकन में देरी1.43s
पहले उत्तर में देरी52.07s

उपलब्ध प्रदाता

(LS आंतरिक इकाइयाँ)
प्रदाताइनपुट मूल्यआउटपुट मूल्य
MiniMax300K1.2M
Fireworks300K1.2M
Novita300K1.2M

बाहरी लिंक