메인 콘텐츠로 건너뛰기

MiMo-V2-Flash (Reasoning)

Xiaomi

설명

MiMo-V2-Flash is a powerful, efficient, and ultra-fast foundation language model that excels in reasoning, coding, and agentic scenarios. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, featuring a hybrid attention architecture with sliding-window and full attention (5:1 ratio, 128-token window). Delivers 150 tokens/sec inference with 256k context window.

출시일
2025-12-16
파라미터
컨텍스트 길이
262K
모달리티
text

능력 레이더

46
general
76
coding
94
reasoning
56
science추정
60
agents
0
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
에이전트형 역량76
53.0
LS
코딩 랭킹63
74.0
AA
종합 랭킹63
73.0
AA
수학 추론9
97.0
AA
과학86
64.0
AA

벤치마크 점수 (LLM Stats)

Agents

Tau-bench80.3%자체 보고
BrowseComp58.3%자체 보고
Terminal-Bench 2.038.5%자체 보고
Terminal-Bench30.5%자체 보고

Biology

GPQA83.7%자체 보고

Code

SWE-Bench Verified73.4%자체 보고
SWE-bench Multilingual71.7%자체 보고

Creativity

Arena-Hard v286.2%자체 보고

Finance

MMLU-Pro84.9%자체 보고

General

LiveCodeBench v680.6%자체 보고
LongBench v260.6%자체 보고
MRCR45.7%자체 보고

Math

AIME 202594.1%자체 보고
HMMT 202584.4%자체 보고
Humanity's Last Exam22.1%자체 보고

AA 평가 지수

Math Index
96.3
Intelligence Index
31.2
Aime 25
1.0
Tau2
1.0
Livecodebench
0.9
Gpqa
0.8
Mmlu Pro
0.8
Ifbench
0.6
Lcr
0.6
Scicode
0.4
Terminalbench Hard
0.3
Hle
0.2

LLM Stats 카테고리 점수

Creativity
90
Writing
90
Language
80
Legal
80
Physics
80
Finance
80
Healthcare
80
Biology
80
Chemistry
80
Math
70
Reasoning
70
Frontend Development
70
General
70
Search
60
Structured Output
60
Tool Calling
60
Long Context
50
Agents
50
Code
50
Vision
20

가격

입력 가격$0.1 / 1M 토큰
출력 가격$0.3 / 1M 토큰
혼합 가격 (3:1)$0.15 / 1M 토큰
캐시 읽기 가격$0.01 / 1M 토큰

속도

토큰/초75.2
첫 토큰 지연2.23s
첫 응답 지연28.81s

공급자 가격 순위

공급자 가격 순위

4개 공급자

최저가: Xiaomi최고가: NanoGPT
공급자입력출력
1Xiaomi주요
$0.1
$0.3
2Qiniu
$0.1
$0.3
3LLM Gateway
$0.1
$0.3
4NanoGPT
$0.102
$0.306

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크