मुख्य सामग्री पर जाएं

MiniMax M1 80k

MiniMaxMiniMaxOpen WeightMIT · Commercial OK

विवरण

MiniMax-M1 is an open-source, large-scale reasoning model that uses a hybrid-attention architecture for efficient long-context processing. It supports up to a 1 million token context window and 80,000-token reasoning output, matching Gemini 2.5 Pro’s scale while being highly cost-effective. Its Lightning Attention mechanism reduces compute requirements to about 30% of DeepSeek R1’s, and a new reinforcement learning algorithm, CISPO, doubles convergence speed compared to other RL methods. Trained on 512 H800s over three weeks, M1 achieves near state-of-the-art results across software engineering, long-context, and tool-use benchmarks, outperforming most open models and rivaling top closed systems.

रिलीज़ तिथि
2025-06-17
पैरामीटर
456.0B
संदर्भ लंबाई
1.0M
मोडैलिटीज़
text

क्षमता रडार

39
general
37
coding
73
reasoning
46
scienceअनुमानित
60
agents
0
multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन#रैंकस्कोरस्रोत
Code Ranking202
41.0
AA
General Ranking220
47.0
AA
Math Reasoning102
75.0
AA
Reasoning17
87.0
LS
Science180
50.0
AA

बेंचमार्क स्कोर (LLM Stats)

Biology

GPQA70.0%स्वयं

Code

LiveCodeBench65.0%स्वयं
SWE-Bench Verified56.0%स्वयं

Communication

TAU-bench Retail63.5%स्वयं
TAU-bench Airline62.0%स्वयं
Multi-Challenge44.7%स्वयं

Factuality

SimpleQA18.5%स्वयं

Finance

MMLU-Pro81.1%स्वयं

General

LongBench v261.5%स्वयं

Long Context

OpenAI-MRCR: 2 needle 128k73.4%स्वयं
OpenAI-MRCR: 2 needle 1M56.2%स्वयं

Math

MATH-50096.8%स्वयं
AIME 202486.0%स्वयं
AIME 202576.9%स्वयं
Humanity's Last Exam8.4%स्वयं

Reasoning

ZebraLogic86.8%स्वयं

AA मूल्यांकन सूचकांक

Math Index
61.0
Intelligence Index
24.4
Coding Index
14.5
Math 500
1.0
Aime
0.8
Mmlu Pro
0.8
Livecodebench
0.7
Gpqa
0.7
Aime 25
0.6
Lcr
0.5
Ifbench
0.4
Scicode
0.4
Tau2
0.3
Hle
0.1
Terminalbench Hard
0.0

LLM Stats श्रेणी स्कोर

Finance
80
Healthcare
80
Language
80
Legal
80
Biology
70
Chemistry
70
Math
70
Physics
70
Structured Output
60
Tool Calling
60
Code
60
Communication
60
Frontend Development
60
General
60
Long Context
60
Reasoning
60
Factuality
20
Vision
10

मूल्य निर्धारण

इनपुट मूल्य$0.55 / 1M tokens
आउटपुट मूल्य$2.2 / 1M tokens
मिश्रित मूल्य (3:1)$0.963 / 1M tokens

गति

टोकन/सेकंड0.0 tokens/s
पहले टोकन में देरी0.00s
पहले उत्तर में देरी0.00s

उपलब्ध प्रदाता

(LS आंतरिक इकाइयाँ)

कोई प्रदाता डेटा उपलब्ध नहीं

बाहरी लिंक