MiMo-V2.5-Pro
Descripción
MiMo-V2.5-Pro is Xiaomi's 1.02T-parameter sparse Mixture-of-Experts language model with 42B active parameters and a 1M-token context window. It inherits the MiMo-V2-Flash hybrid-attention and Multi-Token Prediction design, extends context during pre-training up to 1M tokens, and uses supervised fine-tuning, domain-specialized reinforcement learning, and Multi-Teacher On-Policy Distillation to improve complex software engineering, long-horizon agentic tasks, and ultra-long-context coherence.
Radar de capacidades
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Capacidad agéntica | 29 | 65.0 | LS |
| Razonamiento | 23 | 83.0 | LS |
Puntuaciones de benchmarks (LLM Stats)
Agents
Biology
Code
Finance
General
Language
Long Context
Math
Reasoning
Índices de evaluación AA
No hay datos de evaluación AA disponibles
Puntuaciones por categoría LLM Stats
Precios
Velocidad
No hay datos de velocidad disponibles
Ranking de Precios por Proveedor
Ranking de Precios por Proveedor
6 proveedores
Comparar precios entre diferentes proveedores de API para este modelo.