Перейти к основному содержанию

Hermes 4 - Llama-3.1 405B (Non-reasoning)

Nous ResearchLlama
Дата выхода
2025-08-27
Параметры
Длина контекста
Модальности

Радар способностей

27
general
50
coding
22
reasoning
37
scienceоцен.
80
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга269
34.0
AA
Общий рейтинг330
33.0
AA
Математическое мышление320
15.0
AA
Наука303
38.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA50.5%Сам.

Code

HumanEval88.4%Сам.

Finance

MMLU86.0%Сам.
MMLU-Pro68.9%Сам.

General

IFEval92.1%Сам.
MBPP EvalPlus87.6%Сам.
BFCL v277.3%Сам.

Math

MGSM91.1%Сам.
MATH77.0%Сам.

Индексы оценки AA

Math Index
15.3
Intelligence Index
8.8
Mmlu Pro
0.7
Livecodebench
0.5
Gpqa
0.5
Ifbench
0.3
Scicode
0.3
Tau2
0.3
Lcr
0.2
Aime 25
0.2
Terminalbench Hard
0.1
Hle
0.0

Оценки категорий LLM Stats

Structured Output
90
Instruction Following
90
Code
90
Math
80
Reasoning
80
Language
80
Legal
80
Finance
80
Healthcare
80
Tool Calling
80
General
70
Physics
50
Biology
50
Chemistry
50

Цены

Цена ввода$1 / 1M токенов
Цена вывода$3 / 1M токенов
Смешанная цена (3:1)$1.5 / 1M токенов

Скорость

Токенов/сек39.3
Задержка первого токена0.78s
Время до первого ответа0.78s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

1 провайдеров

ПровайдерВводВывод
1Nous ResearchОсновной
$1
$3

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки