DeepHermes 3 - Mistral 24B Preview (Non-reasoning)
Nous ResearchMistral
Дата выхода
2025-03-13
Параметры
—
Длина контекста
—
Модальности
—
Радар способностей
21
general
20
coding
28
reasoning
26
scienceоцен.
26
agents
60
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 353 | 21.0 | AA |
| Общий рейтинг | 408 | 25.0 | AA |
| Математическое мышление | 263 | 31.0 | AA |
| Наука | 404 | 26.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
71.2%Сам.
Code
LiveCodeBench
63.6%Сам.
Creativity
Arena Hard
58.3%Сам.
Finance
MMLU-Pro
78.0%Сам.
General
MMMU-Pro
60.0%Сам.
IFBench
48.0%Сам.
Language
COLLIE
62.9%Сам.
Long Context
AA-LCR
71.2%Сам.
Math
AIME 2025
83.8%Сам.
Индексы оценки AA
Intelligence Index5.3
Math 5000.6
Mmlu Pro0.6
Gpqa0.4
Scicode0.2
Livecodebench0.2
Aime0.0
Hle0.0
Оценки категорий LLM Stats
Legal80
Math80
Finance80
Healthcare80
Language70
Long Context70
Physics70
Reasoning70
Biology70
Chemistry70
Multimodal60
General60
Code60
Creativity60
Vision60
Writing60
Instruction Following50
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
2 провайдеров
Самый дешевый: ChutesСамый дорогой: NanoGPT
ПровайдерВводВывод
1ChutesСамый дешевый
$0.0245
$0.0978
2NanoGPT
$0.3
$0.3
Сравнение цен разных API-провайдеров для этой модели.