Passer au contenu principal

Hermes 4 - Llama-3.1 405B (Non-reasoning)

Nous ResearchLlama
Date de sortie
2025-08-27
Paramètres
Longueur du contexte
Modalités

Radar de capacités

27
general
50
coding
22
reasoning
37
scienceest.
80
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement codage269
34.0
AA
Classement général330
33.0
AA
Raisonnement mathématique320
15.0
AA
Science303
38.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA50.5%Aut.

Code

HumanEval88.4%Aut.

Finance

MMLU86.0%Aut.
MMLU-Pro68.9%Aut.

General

IFEval92.1%Aut.
MBPP EvalPlus87.6%Aut.
BFCL v277.3%Aut.

Math

MGSM91.1%Aut.
MATH77.0%Aut.

Indices d'évaluation AA

Math Index
15.3
Intelligence Index
8.8
Mmlu Pro
0.7
Livecodebench
0.5
Gpqa
0.5
Ifbench
0.3
Scicode
0.3
Tau2
0.3
Lcr
0.2
Aime 25
0.2
Terminalbench Hard
0.1
Hle
0.0

Scores par catégorie LLM Stats

Instruction Following
90
Structured Output
90
Code
90
Language
80
Legal
80
Math
80
Reasoning
80
Finance
80
Healthcare
80
Tool Calling
80
General
70
Physics
50
Biology
50
Chemistry
50

Tarification

Prix d'entrée$1 / 1M tokens
Prix de sortie$3 / 1M tokens
Prix mixte (3:1)$1.5 / 1M tokens

Vitesse

Tokens/sec42.2
Délai du premier token0.78s
Temps de réponse0.78s

Classement des Prix par Fournisseur

Classement des Prix par Fournisseur

1 fournisseurs

FournisseurEntréeSortie
1Nous ResearchPRINCIPAL
$1
$3

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes