Devstral Small (May '25)
MistralMistral
Дата выхода
2025-05-21
Параметры
—
Длина контекста
256K
Модальности
image, text
Радар способностей
26
general
26
coding
33
reasoning
29
scienceоцен.
31
agents
60
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 336 | 24.0 | AA |
| Общий рейтинг | 319 | 34.0 | AA |
| Математическое мышление | 240 | 37.0 | AA |
| Наука | 384 | 29.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
71.2%Сам.
Code
LiveCodeBench
63.6%Сам.
Creativity
Arena Hard
58.3%Сам.
Finance
MMLU-Pro
78.0%Сам.
General
MMMU-Pro
60.0%Сам.
IFBench
48.0%Сам.
Language
COLLIE
62.9%Сам.
Long Context
AA-LCR
71.2%Сам.
Math
AIME 2025
83.8%Сам.
Индексы оценки AA
Intelligence Index11.8
Math 5000.7
Mmlu Pro0.6
Gpqa0.4
Tau20.4
Ifbench0.3
Lcr0.3
Livecodebench0.3
Scicode0.2
Aime0.1
Terminalbench Hard0.1
Hle0.0
Оценки категорий LLM Stats
Legal80
Math80
Finance80
Healthcare80
Language70
Long Context70
Physics70
Reasoning70
Biology70
Chemistry70
Multimodal60
General60
Code60
Creativity60
Vision60
Writing60
Instruction Following50
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
3 провайдеров
Самый дешевый: IO.NETСамый дорогой: Mistral
ПровайдерВводВывод
1IO.NETСамый дешевый
$0.05
$0.22
2NanoGPT
$0.06
$0.06
3Mistral
$0.1
$0.3
Сравнение цен разных API-провайдеров для этой модели.