Перейти к основному содержанию

Hermes 4 - Llama-3.1 70B (Reasoning)

Nous ResearchLlama
Дата выхода
2025-08-27
Параметры
Длина контекста
131K
Модальности
text

Радар способностей

31
general
58
coding
69
reasoning
45
scienceоцен.
80
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга298
29.0
AA
Общий рейтинг315
34.0
AA
Математическое мышление121
69.0
AA
Наука212
47.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA50.5%Сам.

Code

HumanEval88.4%Сам.

Finance

MMLU86.0%Сам.
MMLU-Pro68.9%Сам.

General

IFEval92.1%Сам.
MBPP EvalPlus87.6%Сам.
BFCL v277.3%Сам.

Math

MGSM91.1%Сам.
MATH77.0%Сам.

Индексы оценки AA

Math Index
68.7
Intelligence Index
10.0
Mmlu Pro
0.8
Gpqa
0.7
Aime 25
0.7
Livecodebench
0.7
Scicode
0.3
Ifbench
0.3
Tau2
0.2
Hle
0.1
Lcr
0.1
Terminalbench Hard
0.0

Оценки категорий LLM Stats

Instruction Following
90
Structured Output
90
Code
90
Language
80
Legal
80
Math
80
Reasoning
80
Finance
80
Healthcare
80
Tool Calling
80
General
70
Physics
50
Biology
50
Chemistry
50

Цены

Цена ввода$0.13 / 1M токенов
Цена вывода$0.4 / 1M токенов
Смешанная цена (3:1)$0.198 / 1M токенов

Скорость

Токенов/сек87.0
Задержка первого токена0.66s
Время до первого ответа23.65s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

2 провайдеров

Самый дешевый: Nous ResearchСамый дорогой: NanoGPT
ПровайдерВводВывод
1Nous ResearchОсновной
$0.13
$0.4
2NanoGPT
$0.25
$1.5

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки