Hermes 4 - Llama-3.1 405B (Non-reasoning)

Nous ResearchLlama

Дата выхода

2025-08-27

Параметры

—

Длина контекста

—

Модальности

—

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	269	34.0	AA
Общий рейтинг	330	33.0	AA
Математическое мышление	320	15.0	AA
Наука	303	38.0	AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA

50.5%Сам.

Code

HumanEval

88.4%Сам.

Finance

MMLU

86.0%Сам.

MMLU-Pro

68.9%Сам.

General

IFEval

92.1%Сам.

MBPP EvalPlus

87.6%Сам.

BFCL v2

77.3%Сам.

Math

MGSM

91.1%Сам.

MATH

77.0%Сам.

Индексы оценки AA

Math Index

15.3

Intelligence Index

8.8

Mmlu Pro

0.7

Livecodebench

0.5

Gpqa

0.5

Ifbench

0.3

Scicode

0.3

Tau2

0.3

Lcr

0.2

Aime 25

0.2

Terminalbench Hard

0.1

Hle

0.0

Оценки категорий LLM Stats

Structured Output

Instruction Following

Code

Math

Reasoning

Language

Legal

Finance

Healthcare

Tool Calling

General

Physics

Biology

Chemistry

Цены

Цена ввода$1 / 1M токенов

Цена вывода$3 / 1M токенов

Смешанная цена (3:1)$1.5 / 1M токенов

Скорость

Токенов/сек39.3

Задержка первого токена0.78s

Время до первого ответа0.78s

Рейтинг цен провайдеров

1 провайдеров

ПровайдерВводВывод

1Nous ResearchОсновной

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

Artificial Analysis