Devstral Small (May '25)
MistralMistral
Date de sortie
2025-05-21
Paramètres
—
Longueur du contexte
256K
Modalités
image, text
Radar de capacités
26
general
26
coding
33
reasoning
29
scienceest.
31
agents
60
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Classement codage | 336 | 24.0 | AA |
| Classement général | 319 | 34.0 | AA |
| Raisonnement mathématique | 240 | 37.0 | AA |
| Science | 384 | 29.0 | AA |
Scores de benchmarks (LLM Stats)
Biology
GPQA
71.2%Aut.
Code
LiveCodeBench
63.6%Aut.
Creativity
Arena Hard
58.3%Aut.
Finance
MMLU-Pro
78.0%Aut.
General
MMMU-Pro
60.0%Aut.
IFBench
48.0%Aut.
Language
COLLIE
62.9%Aut.
Long Context
AA-LCR
71.2%Aut.
Math
AIME 2025
83.8%Aut.
Indices d'évaluation AA
Intelligence Index11.8
Math 5000.7
Mmlu Pro0.6
Gpqa0.4
Tau20.4
Ifbench0.3
Lcr0.3
Livecodebench0.3
Scicode0.2
Aime0.1
Terminalbench Hard0.1
Hle0.0
Scores par catégorie LLM Stats
Legal80
Math80
Finance80
Healthcare80
Language70
Long Context70
Physics70
Reasoning70
Biology70
Chemistry70
Multimodal60
General60
Code60
Creativity60
Vision60
Writing60
Instruction Following50
Tarification
Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit
Vitesse
Tokens/sec0.0
Délai du premier token0.00s
Temps de réponse0.00s
Classement des Prix par Fournisseur
Classement des Prix par Fournisseur
3 fournisseurs
Moins cher: IO.NETPlus cher: Mistral
FournisseurEntréeSortie
1IO.NETMoins cher
$0.05
$0.22
2NanoGPT
$0.06
$0.06
3Mistral
$0.1
$0.3
Comparer les prix entre différents fournisseurs API pour ce modèle.