메인 콘텐츠로 건너뛰기

MiMo-V2-Flash (Non-reasoning)

Xiaomi오픈 웨이트MIT · 상업적 사용 가능

설명

MiMo-V2-Flash is a powerful, efficient, and ultra-fast foundation language model that excels in reasoning, coding, and agentic scenarios. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, featuring a hybrid attention architecture with sliding-window and full attention (5:1 ratio, 128-token window). Delivers 150 tokens/sec inference with 256k context window.

출시일
2025-12-16
파라미터
309.0B
컨텍스트 길이
262K
모달리티
text

능력 레이더

36
general
37
coding
67
reasoning
40
science추정
60
agents
0
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
코딩 랭킹229
42.0
AA
종합 랭킹152
56.0
AA
수학 추론128
68.0
AA
과학274
41.0
AA

벤치마크 점수 (LLM Stats)

Agents

Tau-bench80.3%자체 보고
BrowseComp58.3%자체 보고
Terminal-Bench 2.038.5%자체 보고
Terminal-Bench30.5%자체 보고

Biology

GPQA83.7%자체 보고

Code

SWE-Bench Verified73.4%자체 보고
SWE-bench Multilingual71.7%자체 보고

Creativity

Arena-Hard v286.2%자체 보고

Finance

MMLU-Pro84.9%자체 보고

General

LiveCodeBench v680.6%자체 보고
LongBench v260.6%자체 보고
MRCR45.7%자체 보고

Math

AIME 202594.1%자체 보고
HMMT 202584.4%자체 보고
Humanity's Last Exam22.1%자체 보고

AA 평가 지수

Math Index
67.7
Intelligence Index
23.1
Tau2
0.8
Mmlu Pro
0.7
Aime 25
0.7
Gpqa
0.7
Livecodebench
0.4
Ifbench
0.4
Lcr
0.3
Scicode
0.3
Terminalbench Hard
0.3
Hle
0.1

LLM Stats 카테고리 점수

Creativity
90
Writing
90
Language
80
Legal
80
Physics
80
Finance
80
Healthcare
80
Biology
80
Chemistry
80
Math
70
Reasoning
70
Frontend Development
70
General
70
Search
60
Structured Output
60
Tool Calling
60
Long Context
50
Agents
50
Code
50
Vision
20

가격

입력 가격$0.1 / 1M 토큰
출력 가격$0.3 / 1M 토큰
혼합 가격 (3:1)$0.15 / 1M 토큰
캐시 읽기 가격$0.01 / 1M 토큰

속도

토큰/초77.4
첫 토큰 지연3.88s
첫 응답 지연3.88s

공급자 가격 순위

공급자 가격 순위

3개 공급자

최저가: Chutes최고가: NanoGPT
공급자입력출력
1Chutes최저가
$0.09
$0.29
2Xiaomi주요
$0.1
$0.3
3NanoGPT
$0.102
$0.306

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크