Hermes 4 - Llama-3.1 70B (Non-reasoning)

Nous ResearchLlama

Date de sortie

2025-08-27

Paramètres

—

Longueur du contexte

131K

Modalités

text

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement codage	437	11.0	AA
Classement général	390	28.0	AA
Raisonnement mathématique	334	11.0	AA
Science	344	33.0	AA

Scores de benchmarks (LLM Stats)

Biology

GPQA

50.5%Aut.

Code

HumanEval

88.4%Aut.

Finance

MMLU

86.0%Aut.

MMLU-Pro

68.9%Aut.

General

IFEval

92.1%Aut.

MBPP EvalPlus

87.6%Aut.

BFCL v2

77.3%Aut.

Math

MGSM

91.1%Aut.

MATH

77.0%Aut.

Indices d'évaluation AA

Math Index

11.3

Intelligence Index

6.9

Mmlu Pro

0.7

Gpqa

0.5

Ifbench

0.3

Scicode

0.3

Livecodebench

0.3

Tau2

0.2

Aime 25

0.1

Hle

0.0

Lcr

0.0

Terminalbench Hard

0.0

Scores par catégorie LLM Stats

Instruction Following

Structured Output

Code

Language

Legal

Math

Reasoning

Finance

Healthcare

Tool Calling

General

Physics

Biology

Chemistry

Tarification

Prix d'entrée$0.13 / 1M tokens

Prix de sortie$0.4 / 1M tokens

Prix mixte (3:1)$0.198 / 1M tokens

Vitesse

Tokens/sec86.3

Délai du premier token0.64s

Temps de réponse0.64s

Classement des Prix par Fournisseur

1 fournisseurs

FournisseurEntréeSortie

1Nous ResearchPRINCIPAL

$0.13

$0.4

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

Artificial Analysis