MiMo-V2-Flash (Non-reasoning)
Xiaomi오픈 웨이트MIT · 상업적 사용 가능
설명
MiMo-V2-Flash is a powerful, efficient, and ultra-fast foundation language model that excels in reasoning, coding, and agentic scenarios. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, featuring a hybrid attention architecture with sliding-window and full attention (5:1 ratio, 128-token window). Delivers 150 tokens/sec inference with 256k context window.
출시일
2025-12-16
파라미터
309.0B
컨텍스트 길이
262K
모달리티
text
능력 레이더
36
general
37
coding
67
reasoning
40
science추정
60
agents
0
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
벤치마크 점수 (LLM Stats)
Agents
Tau-bench
80.3%자체 보고
BrowseComp
58.3%자체 보고
Terminal-Bench 2.0
38.5%자체 보고
Terminal-Bench
30.5%자체 보고
Biology
GPQA
83.7%자체 보고
Code
SWE-Bench Verified
73.4%자체 보고
SWE-bench Multilingual
71.7%자체 보고
Creativity
Arena-Hard v2
86.2%자체 보고
Finance
MMLU-Pro
84.9%자체 보고
General
LiveCodeBench v6
80.6%자체 보고
LongBench v2
60.6%자체 보고
MRCR
45.7%자체 보고
Math
AIME 2025
94.1%자체 보고
HMMT 2025
84.4%자체 보고
Humanity's Last Exam
22.1%자체 보고
AA 평가 지수
Math Index67.7
Intelligence Index23.1
Tau20.8
Mmlu Pro0.7
Aime 250.7
Gpqa0.7
Livecodebench0.4
Ifbench0.4
Lcr0.3
Scicode0.3
Terminalbench Hard0.3
Hle0.1
LLM Stats 카테고리 점수
Creativity90
Writing90
Language80
Legal80
Physics80
Finance80
Healthcare80
Biology80
Chemistry80
Math70
Reasoning70
Frontend Development70
General70
Search60
Structured Output60
Tool Calling60
Long Context50
Agents50
Code50
Vision20
가격
입력 가격$0.1 / 1M 토큰
출력 가격$0.3 / 1M 토큰
혼합 가격 (3:1)$0.15 / 1M 토큰
캐시 읽기 가격$0.01 / 1M 토큰
속도
토큰/초77.4
첫 토큰 지연3.88s
첫 응답 지연3.88s
공급자 가격 순위
공급자 가격 순위
3개 공급자
최저가: Chutes최고가: NanoGPT
공급자입력출력
1Chutes최저가
$0.09
$0.29
2Xiaomi주요
$0.1
$0.3
3NanoGPT
$0.102
$0.306
이 모델의 다양한 API 공급자 간 가격 비교.