메인 콘텐츠로 건너뛰기

MiniMax-M2.1

MiniMaxMiniMaxOpen WeightMIT · Commercial OK

설명

MiniMax M2.1 is an enhanced large language model focused on multi-language programming and real-world complex tasks. It features exceptional capabilities across Rust, Java, Golang, C++, Kotlin, Objective-C, TypeScript, JavaScript and more, with industry-leading multilingual performance that outperforms Claude Sonnet 4.5 and approaches Claude Opus 4.5. M2.1 significantly strengthens native Android and iOS development, delivers enhanced design comprehension and aesthetic expression for web/app scenarios, and provides more concise responses with improved speed and reduced token consumption. It excels across various coding agent frameworks including Claude Code, Droid (Factory AI), Cline, Kilo Code, Roo Code, and BlackBox.

출시일
2025-12-23
파라미터
230.0B
컨텍스트 길이
197K
모달리티
text

능력 레이더

51
general
50
coding
83
reasoning
56
science추정
70
agents
0
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
Agents & Tools73
51.0
LS
Code Ranking83
65.0
AA
General Ranking54
78.0
AA
Math Reasoning70
84.0
AA
Science62
68.0
AA

벤치마크 점수 (LLM Stats)

Agents

BrowseComp62.0%자체 보고
Terminal-Bench47.9%자체 보고
Toolathlon43.5%자체 보고

Biology

GPQA81.0%자체 보고
SciCode39.0%자체 보고

Code

VIBE Web91.5%자체 보고
VIBE Android89.7%자체 보고
VIBE88.6%자체 보고
VIBE iOS88.0%자체 보고
VIBE Simulation87.1%자체 보고
VIBE Backend86.7%자체 보고
LiveCodeBench78.0%자체 보고
SWE-bench Multilingual72.5%자체 보고
SWT-Bench69.3%자체 보고
SWE-Bench Verified67.0%자체 보고
Multi-SWE-Bench49.4%자체 보고
OctoCodingBench26.1%자체 보고
SWE-Review8.9%자체 보고
SWE-Perf3.1%자체 보고

Communication

Tau2 Telecom87.0%자체 보고

Finance

MMLU-Pro88.0%자체 보고

General

IFBench70.0%자체 보고

Long Context

AA-LCR62.0%자체 보고

Math

AIME 202581.0%자체 보고
Humanity's Last Exam22.0%자체 보고

AA 평가 지수

Math Index
82.7
Intelligence Index
39.4
Coding Index
32.8
Mmlu Pro
0.9
Tau2
0.9
Gpqa
0.8
Aime 25
0.8
Livecodebench
0.8
Ifbench
0.7
Lcr
0.6
Scicode
0.4
Terminalbench Hard
0.3
Hle
0.2

LLM Stats 카테고리 점수

Communication
90
Finance
90
Healthcare
90
Language
90
Legal
90
General
80
Tool Calling
70
Frontend Development
70
Instruction Following
70
Biology
60
Chemistry
60
Code
60
Long Context
60
Math
60
Physics
60
Reasoning
60
Search
60
Agents
50
Vision
20

가격

입력 가격$0.3 / 1M tokens
출력 가격$1.2 / 1M tokens
혼합 가격 (3:1)$0.525 / 1M tokens

속도

토큰/초86.3 tokens/s
첫 토큰 지연1.30s
첫 응답 지연24.49s

사용 가능한 프로바이더

(LS 내부 단위)
프로바이더입력 가격출력 가격
MiniMax300K1.2M

외부 링크