Saltar al contenido principal

MiMo-V2-Flash (Reasoning)

Xiaomi

Descripción

MiMo-V2-Flash is a powerful, efficient, and ultra-fast foundation language model that excels in reasoning, coding, and agentic scenarios. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, featuring a hybrid attention architecture with sliding-window and full attention (5:1 ratio, 128-token window). Delivers 150 tokens/sec inference with 256k context window.

Fecha de lanzamiento
2025-12-16
Parámetros
Longitud del contexto
262K
Modalidades
text

Radar de capacidades

46
general
76
coding
94
reasoning
56
scienceest.
60
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Capacidad agéntica76
53.0
LS
Ranking de codificación63
74.0
AA
Ranking general63
73.0
AA
Razonamiento matemático9
97.0
AA
Ciencia86
64.0
AA

Puntuaciones de benchmarks (LLM Stats)

Agents

Tau-bench80.3%Aut.
BrowseComp58.3%Aut.
Terminal-Bench 2.038.5%Aut.
Terminal-Bench30.5%Aut.

Biology

GPQA83.7%Aut.

Code

SWE-Bench Verified73.4%Aut.
SWE-bench Multilingual71.7%Aut.

Creativity

Arena-Hard v286.2%Aut.

Finance

MMLU-Pro84.9%Aut.

General

LiveCodeBench v680.6%Aut.
LongBench v260.6%Aut.
MRCR45.7%Aut.

Math

AIME 202594.1%Aut.
HMMT 202584.4%Aut.
Humanity's Last Exam22.1%Aut.

Índices de evaluación AA

Math Index
96.3
Intelligence Index
31.2
Aime 25
1.0
Tau2
1.0
Livecodebench
0.9
Gpqa
0.8
Mmlu Pro
0.8
Ifbench
0.6
Lcr
0.6
Scicode
0.4
Terminalbench Hard
0.3
Hle
0.2

Puntuaciones por categoría LLM Stats

Creativity
90
Writing
90
Language
80
Legal
80
Physics
80
Finance
80
Healthcare
80
Biology
80
Chemistry
80
Math
70
Reasoning
70
Frontend Development
70
General
70
Search
60
Structured Output
60
Tool Calling
60
Long Context
50
Agents
50
Code
50
Vision
20

Precios

Precio de entrada$0.1 / 1M tokens
Precio de salida$0.3 / 1M tokens
Precio mixto (3:1)$0.15 / 1M tokens
Precio de lectura caché$0.01 / 1M tokens

Velocidad

Tokens/seg75.2
Retraso del primer token2.23s
Tiempo hasta la respuesta28.81s

Ranking de Precios por Proveedor

Ranking de Precios por Proveedor

4 proveedores

Más barato: XiaomiMás caro: NanoGPT
ProveedorEntradaSalida
1XiaomiPRINCIPAL
$0.1
$0.3
2Qiniu
$0.1
$0.3
3LLM Gateway
$0.1
$0.3
4NanoGPT
$0.102
$0.306

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas