Saltar al contenido principal

MiMo-V2-Flash (Non-reasoning)

XiaomiOpen WeightMIT · Uso Comercial

Descripción

MiMo-V2-Flash is a powerful, efficient, and ultra-fast foundation language model that excels in reasoning, coding, and agentic scenarios. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, featuring a hybrid attention architecture with sliding-window and full attention (5:1 ratio, 128-token window). Delivers 150 tokens/sec inference with 256k context window.

Fecha de lanzamiento
2025-12-16
Parámetros
309.0B
Longitud del contexto
262K
Modalidades
text

Radar de capacidades

36
general
37
coding
67
reasoning
40
scienceest.
60
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking de codificación229
42.0
AA
Ranking general152
56.0
AA
Razonamiento matemático128
68.0
AA
Ciencia274
41.0
AA

Puntuaciones de benchmarks (LLM Stats)

Agents

Tau-bench80.3%Aut.
BrowseComp58.3%Aut.
Terminal-Bench 2.038.5%Aut.
Terminal-Bench30.5%Aut.

Biology

GPQA83.7%Aut.

Code

SWE-Bench Verified73.4%Aut.
SWE-bench Multilingual71.7%Aut.

Creativity

Arena-Hard v286.2%Aut.

Finance

MMLU-Pro84.9%Aut.

General

LiveCodeBench v680.6%Aut.
LongBench v260.6%Aut.
MRCR45.7%Aut.

Math

AIME 202594.1%Aut.
HMMT 202584.4%Aut.
Humanity's Last Exam22.1%Aut.

Índices de evaluación AA

Math Index
67.7
Intelligence Index
23.1
Tau2
0.8
Mmlu Pro
0.7
Aime 25
0.7
Gpqa
0.7
Livecodebench
0.4
Ifbench
0.4
Lcr
0.3
Scicode
0.3
Terminalbench Hard
0.3
Hle
0.1

Puntuaciones por categoría LLM Stats

Creativity
90
Writing
90
Language
80
Legal
80
Physics
80
Finance
80
Healthcare
80
Biology
80
Chemistry
80
Math
70
Reasoning
70
Frontend Development
70
General
70
Search
60
Structured Output
60
Tool Calling
60
Long Context
50
Agents
50
Code
50
Vision
20

Precios

Precio de entrada$0.1 / 1M tokens
Precio de salida$0.3 / 1M tokens
Precio mixto (3:1)$0.15 / 1M tokens
Precio de lectura caché$0.01 / 1M tokens

Velocidad

Tokens/seg77.4
Retraso del primer token3.88s
Tiempo hasta la respuesta3.88s

Ranking de Precios por Proveedor

Ranking de Precios por Proveedor

3 proveedores

Más barato: ChutesMás caro: NanoGPT
ProveedorEntradaSalida
1ChutesMás barato
$0.09
$0.29
2XiaomiPRINCIPAL
$0.1
$0.3
3NanoGPT
$0.102
$0.306

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas