MiMo-V2-Flash (Non-reasoning)
XiaomiOpen WeightMIT · Uso Comercial
Descripción
MiMo-V2-Flash is a powerful, efficient, and ultra-fast foundation language model that excels in reasoning, coding, and agentic scenarios. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, featuring a hybrid attention architecture with sliding-window and full attention (5:1 ratio, 128-token window). Delivers 150 tokens/sec inference with 256k context window.
Fecha de lanzamiento
2025-12-16
Parámetros
309.0B
Longitud del contexto
262K
Modalidades
text
Radar de capacidades
36
general
37
coding
67
reasoning
40
scienceest.
60
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Ranking de codificación | 229 | 42.0 | AA |
| Ranking general | 152 | 56.0 | AA |
| Razonamiento matemático | 128 | 68.0 | AA |
| Ciencia | 274 | 41.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Agents
Tau-bench
80.3%Aut.
BrowseComp
58.3%Aut.
Terminal-Bench 2.0
38.5%Aut.
Terminal-Bench
30.5%Aut.
Biology
GPQA
83.7%Aut.
Code
SWE-Bench Verified
73.4%Aut.
SWE-bench Multilingual
71.7%Aut.
Creativity
Arena-Hard v2
86.2%Aut.
Finance
MMLU-Pro
84.9%Aut.
General
LiveCodeBench v6
80.6%Aut.
LongBench v2
60.6%Aut.
MRCR
45.7%Aut.
Math
AIME 2025
94.1%Aut.
HMMT 2025
84.4%Aut.
Humanity's Last Exam
22.1%Aut.
Índices de evaluación AA
Math Index67.7
Intelligence Index23.1
Tau20.8
Mmlu Pro0.7
Aime 250.7
Gpqa0.7
Livecodebench0.4
Ifbench0.4
Lcr0.3
Scicode0.3
Terminalbench Hard0.3
Hle0.1
Puntuaciones por categoría LLM Stats
Creativity90
Writing90
Language80
Legal80
Physics80
Finance80
Healthcare80
Biology80
Chemistry80
Math70
Reasoning70
Frontend Development70
General70
Search60
Structured Output60
Tool Calling60
Long Context50
Agents50
Code50
Vision20
Precios
Precio de entrada$0.1 / 1M tokens
Precio de salida$0.3 / 1M tokens
Precio mixto (3:1)$0.15 / 1M tokens
Precio de lectura caché$0.01 / 1M tokens
Velocidad
Tokens/seg77.4
Retraso del primer token3.88s
Tiempo hasta la respuesta3.88s
Ranking de Precios por Proveedor
Ranking de Precios por Proveedor
3 proveedores
Más barato: ChutesMás caro: NanoGPT
ProveedorEntradaSalida
1ChutesMás barato
$0.09
$0.29
2XiaomiPRINCIPAL
$0.1
$0.3
3NanoGPT
$0.102
$0.306
Comparar precios entre diferentes proveedores de API para este modelo.