Devstral Small (May '25)
MistralMistral
Fecha de lanzamiento
2025-05-21
Parámetros
—
Longitud del contexto
256K
Modalidades
image, text
Radar de capacidades
26
general
26
coding
33
reasoning
29
scienceest.
31
agents
60
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Ranking de codificación | 336 | 24.0 | AA |
| Ranking general | 319 | 34.0 | AA |
| Razonamiento matemático | 240 | 37.0 | AA |
| Ciencia | 384 | 29.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Biology
GPQA
71.2%Aut.
Code
LiveCodeBench
63.6%Aut.
Creativity
Arena Hard
58.3%Aut.
Finance
MMLU-Pro
78.0%Aut.
General
MMMU-Pro
60.0%Aut.
IFBench
48.0%Aut.
Language
COLLIE
62.9%Aut.
Long Context
AA-LCR
71.2%Aut.
Math
AIME 2025
83.8%Aut.
Índices de evaluación AA
Intelligence Index11.8
Math 5000.7
Mmlu Pro0.6
Gpqa0.4
Tau20.4
Ifbench0.3
Lcr0.3
Livecodebench0.3
Scicode0.2
Aime0.1
Terminalbench Hard0.1
Hle0.0
Puntuaciones por categoría LLM Stats
Legal80
Math80
Finance80
Healthcare80
Language70
Long Context70
Physics70
Reasoning70
Biology70
Chemistry70
Multimodal60
General60
Code60
Creativity60
Vision60
Writing60
Instruction Following50
Precios
Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis
Velocidad
Tokens/seg0.0
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s
Ranking de Precios por Proveedor
Ranking de Precios por Proveedor
3 proveedores
Más barato: IO.NETMás caro: Mistral
ProveedorEntradaSalida
1IO.NETMás barato
$0.05
$0.22
2NanoGPT
$0.06
$0.06
3Mistral
$0.1
$0.3
Comparar precios entre diferentes proveedores de API para este modelo.