Hermes 4 - Llama-3.1 70B (Reasoning)
Nous ResearchLlama
Дата выхода
2025-08-27
Параметры
—
Длина контекста
131K
Модальности
text
Радар способностей
31
general
58
coding
69
reasoning
45
scienceоцен.
80
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 298 | 29.0 | AA |
| Общий рейтинг | 315 | 34.0 | AA |
| Математическое мышление | 121 | 69.0 | AA |
| Наука | 212 | 47.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
50.5%Сам.
Code
HumanEval
88.4%Сам.
Finance
MMLU
86.0%Сам.
MMLU-Pro
68.9%Сам.
General
IFEval
92.1%Сам.
MBPP EvalPlus
87.6%Сам.
BFCL v2
77.3%Сам.
Math
MGSM
91.1%Сам.
MATH
77.0%Сам.
Индексы оценки AA
Math Index68.7
Intelligence Index10.0
Mmlu Pro0.8
Gpqa0.7
Aime 250.7
Livecodebench0.7
Scicode0.3
Ifbench0.3
Tau20.2
Hle0.1
Lcr0.1
Terminalbench Hard0.0
Оценки категорий LLM Stats
Instruction Following90
Structured Output90
Code90
Language80
Legal80
Math80
Reasoning80
Finance80
Healthcare80
Tool Calling80
General70
Physics50
Biology50
Chemistry50
Цены
Цена ввода$0.13 / 1M токенов
Цена вывода$0.4 / 1M токенов
Смешанная цена (3:1)$0.198 / 1M токенов
Скорость
Токенов/сек87.0
Задержка первого токена0.66s
Время до первого ответа23.65s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
2 провайдеров
Самый дешевый: Nous ResearchСамый дорогой: NanoGPT
ПровайдерВводВывод
1Nous ResearchОсновной
$0.13
$0.4
2NanoGPT
$0.25
$1.5
Сравнение цен разных API-провайдеров для этой модели.