Saltar al contenido principal

MiMo-V2-Flash (Non-reasoning)

XiaomiOpen WeightMIT · Commercial OK

Descripción

MiMo-V2-Flash is a powerful, efficient, and ultra-fast foundation language model that excels in reasoning, coding, and agentic scenarios. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, featuring a hybrid attention architecture with sliding-window and full attention (5:1 ratio, 128-token window). Delivers 150 tokens/sec inference with 256k context window.

Fecha de lanzamiento
2025-12-16
Parámetros
309.0B
Longitud del contexto
262K
Modalidades
text

Radar de capacidades

40
general
31
coding
67
reasoning
40
scienceest.
60
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Agents & Tools67
53.0
LS
Code Ranking184
43.0
AA
General Ranking137
60.0
AA
Math Reasoning128
68.0
AA
Science252
42.0
AA

Puntuaciones de benchmarks (LLM Stats)

Agents

Tau-bench80.3%Aut.
BrowseComp58.3%Aut.
Terminal-Bench 2.038.5%Aut.
Terminal-Bench30.5%Aut.

Biology

GPQA83.7%Aut.

Code

SWE-Bench Verified73.4%Aut.
SWE-bench Multilingual71.7%Aut.

Creativity

Arena-Hard v286.2%Aut.

Finance

MMLU-Pro84.9%Aut.

General

LiveCodeBench v680.6%Aut.
LongBench v260.6%Aut.
MRCR45.7%Aut.

Math

AIME 202594.1%Aut.
HMMT 202584.4%Aut.
Humanity's Last Exam22.1%Aut.

Índices de evaluación AA

Math Index
67.7
Intelligence Index
30.4
Coding Index
25.8
Tau2
0.8
Mmlu Pro
0.7
Aime 25
0.7
Gpqa
0.7
Livecodebench
0.4
Ifbench
0.4
Lcr
0.3
Scicode
0.3
Terminalbench Hard
0.3
Hle
0.1

Puntuaciones por categoría LLM Stats

Writing
90
Creativity
90
Biology
80
Chemistry
80
Finance
80
Healthcare
80
Language
80
Legal
80
Physics
80
Frontend Development
70
General
70
Math
70
Reasoning
70
Structured Output
60
Tool Calling
60
Search
60
Agents
50
Code
50
Long Context
50
Vision
20

Precios

Precio de entrada$0.1 / 1M tokens
Precio de salida$0.3 / 1M tokens
Precio mixto (3:1)$0.15 / 1M tokens

Velocidad

Tokens/seg129.6 tokens/s
Retraso del primer token1.41s
Tiempo hasta la respuesta1.41s

Proveedores disponibles

(Unidades internas LS)

No hay datos de proveedores disponibles

Fuentes externas