Hermes 4 - Llama-3.1 405B (Non-reasoning)
Nous ResearchLlama
Дата выхода
2025-08-27
Параметры
—
Длина контекста
—
Модальности
—
Радар способностей
27
general
50
coding
22
reasoning
37
scienceоцен.
80
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 269 | 34.0 | AA |
| Общий рейтинг | 330 | 33.0 | AA |
| Математическое мышление | 320 | 15.0 | AA |
| Наука | 303 | 38.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
50.5%Сам.
Code
HumanEval
88.4%Сам.
Finance
MMLU
86.0%Сам.
MMLU-Pro
68.9%Сам.
General
IFEval
92.1%Сам.
MBPP EvalPlus
87.6%Сам.
BFCL v2
77.3%Сам.
Math
MGSM
91.1%Сам.
MATH
77.0%Сам.
Индексы оценки AA
Math Index15.3
Intelligence Index8.8
Mmlu Pro0.7
Livecodebench0.5
Gpqa0.5
Ifbench0.3
Scicode0.3
Tau20.3
Lcr0.2
Aime 250.2
Terminalbench Hard0.1
Hle0.0
Оценки категорий LLM Stats
Structured Output90
Instruction Following90
Code90
Math80
Reasoning80
Language80
Legal80
Finance80
Healthcare80
Tool Calling80
General70
Physics50
Biology50
Chemistry50
Цены
Цена ввода$1 / 1M токенов
Цена вывода$3 / 1M токенов
Смешанная цена (3:1)$1.5 / 1M токенов
Скорость
Токенов/сек39.3
Задержка первого токена0.78s
Время до первого ответа0.78s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
1 провайдеров
ПровайдерВводВывод
1Nous ResearchОсновной
$1
$3
Сравнение цен разных API-провайдеров для этой модели.