Перейти к основному содержанию

Devstral Small (May '25)

MistralMistral
Дата выхода
2025-05-21
Параметры
Длина контекста
256K
Модальности
image, text

Радар способностей

26
general
26
coding
33
reasoning
29
scienceоцен.
31
agents
60
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга336
24.0
AA
Общий рейтинг319
34.0
AA
Математическое мышление240
37.0
AA
Наука384
29.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA71.2%Сам.

Code

LiveCodeBench63.6%Сам.

Creativity

Arena Hard58.3%Сам.

Finance

MMLU-Pro78.0%Сам.

General

MMMU-Pro60.0%Сам.
IFBench48.0%Сам.

Language

COLLIE62.9%Сам.

Long Context

AA-LCR71.2%Сам.

Math

AIME 202583.8%Сам.

Индексы оценки AA

Intelligence Index
11.8
Math 500
0.7
Mmlu Pro
0.6
Gpqa
0.4
Tau2
0.4
Ifbench
0.3
Lcr
0.3
Livecodebench
0.3
Scicode
0.2
Aime
0.1
Terminalbench Hard
0.1
Hle
0.0

Оценки категорий LLM Stats

Legal
80
Math
80
Finance
80
Healthcare
80
Language
70
Long Context
70
Physics
70
Reasoning
70
Biology
70
Chemistry
70
Multimodal
60
General
60
Code
60
Creativity
60
Vision
60
Writing
60
Instruction Following
50

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

3 провайдеров

Самый дешевый: IO.NETСамый дорогой: Mistral
ПровайдерВводВывод
1IO.NETСамый дешевый
$0.05
$0.22
2NanoGPT
$0.06
$0.06
3Mistral
$0.1
$0.3

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки