MiMo-V2-Flash (Non-reasoning)

XiaomiOpen WeightMIT · Uso Comercial

Descripción

MiMo-V2-Flash is a powerful, efficient, and ultra-fast foundation language model that excels in reasoning, coding, and agentic scenarios. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, featuring a hybrid attention architecture with sliding-window and full attention (5:1 ratio, 128-token window). Delivers 150 tokens/sec inference with 256k context window.

Fecha de lanzamiento

2025-12-16

Parámetros

309.0B

Longitud del contexto

262K

Modalidades

text

Radar de capacidades

general

coding

reasoning

scienceest.

agents

multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio	#Posición	Puntuación	Fuente
Ranking de codificación	229	42.0	AA
Ranking general	152	56.0	AA
Razonamiento matemático	128	68.0	AA
Ciencia	274	41.0	AA

Puntuaciones de benchmarks (LLM Stats)

Agents

Tau-bench

80.3%Aut.

BrowseComp

58.3%Aut.

Terminal-Bench 2.0

38.5%Aut.

Terminal-Bench

30.5%Aut.

Biology

GPQA

83.7%Aut.

Code

SWE-Bench Verified

73.4%Aut.

SWE-bench Multilingual

71.7%Aut.

Creativity

Arena-Hard v2

86.2%Aut.

Finance

MMLU-Pro

84.9%Aut.

General

LiveCodeBench v6

80.6%Aut.

LongBench v2

60.6%Aut.

MRCR

45.7%Aut.

Math

AIME 2025

94.1%Aut.

HMMT 2025

84.4%Aut.

Humanity's Last Exam

22.1%Aut.

Índices de evaluación AA

Math Index

67.7

Intelligence Index

23.1

Tau2

0.8

Mmlu Pro

0.7

Aime 25

0.7

Gpqa

0.7

Livecodebench

0.4

Ifbench

0.4

Lcr

0.3

Scicode

0.3

Terminalbench Hard

0.3

Hle

0.1

Puntuaciones por categoría LLM Stats

Creativity

Writing

Language

Legal

Physics

Finance

Healthcare

Biology

Chemistry

Math

Reasoning

Frontend Development

General

Structured Output

Tool Calling

Long Context

Agents

Code

Vision

Precios

Precio de entrada$0.1 / 1M tokens

Precio de salida$0.3 / 1M tokens

Precio mixto (3:1)$0.15 / 1M tokens

Precio de lectura caché$0.01 / 1M tokens

Velocidad

Tokens/seg77.4

Retraso del primer token3.88s

Tiempo hasta la respuesta3.88s

Ranking de Precios por Proveedor

3 proveedores

Más barato: ChutesMás caro: NanoGPT

ProveedorEntradaSalida

1ChutesMás barato

$0.09

$0.29

2XiaomiPRINCIPAL

$0.1

$0.3

3NanoGPT

$0.102

$0.306

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas

LLM Stats Artificial Analysis