Hermes 4 - Llama-3.1 405B (Reasoning)
Nous ResearchLlama
Дата выхода
2025-08-27
Параметры
—
Длина контекста
—
Модальности
—
Радар способностей
31
general
59
coding
70
reasoning
44
scienceоцен.
80
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 243 | 40.0 | AA |
| Общий рейтинг | 316 | 34.0 | AA |
| Математическое мышление | 120 | 70.0 | AA |
| Наука | 238 | 45.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
50.5%Сам.
Code
HumanEval
88.4%Сам.
Finance
MMLU
86.0%Сам.
MMLU-Pro
68.9%Сам.
General
IFEval
92.1%Сам.
MBPP EvalPlus
87.6%Сам.
BFCL v2
77.3%Сам.
Math
MGSM
91.1%Сам.
MATH
77.0%Сам.
Индексы оценки AA
Math Index69.7
Intelligence Index9.0
Mmlu Pro0.8
Gpqa0.7
Aime 250.7
Livecodebench0.7
Ifbench0.3
Scicode0.3
Tau20.2
Lcr0.2
Terminalbench Hard0.1
Hle0.1
Оценки категорий LLM Stats
Instruction Following90
Structured Output90
Code90
Language80
Legal80
Math80
Reasoning80
Finance80
Healthcare80
Tool Calling80
General70
Physics50
Biology50
Chemistry50
Цены
Цена ввода$1 / 1M токенов
Цена вывода$3 / 1M токенов
Смешанная цена (3:1)$1.5 / 1M токенов
Скорость
Токенов/сек39.9
Задержка первого токена0.85s
Время до первого ответа50.94s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
1 провайдеров
ПровайдерВводВывод
1Nous ResearchОсновной
$1
$3
Сравнение цен разных API-провайдеров для этой модели.