Passer au contenu principal

Hermes 3 - Llama-3.1 70B

Nous ResearchLlamaOpen WeightApache 2.0 · Commercial OK

Description

Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.

Date de sortie
2024-08-15
Paramètres
70.0B
Longueur du contexte
131K
Modalités
text

Radar de capacités

24
general
20
coding
25
reasoning
27
scienceest.
0
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Code Ranking347
20.0
AA
General Ranking382
28.0
AA
Math Reasoning279
27.0
AA
Reasoning43
70.0
LS
Science381
27.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA66.1%Aut.

Communication

MT-Bench8.99 / 100Aut.

Finance

MMLU79.1%Aut.
TruthfulQA63.3%Aut.
MMLU-Pro47.2%Aut.

General

PIQA84.4%Aut.
ARC-E83.0%Aut.
IFBench81.2%Aut.
ARC-C65.5%Aut.
AGIEval56.2%Aut.
OpenBookQA49.4%Aut.

Language

BoolQ88.0%Aut.
Winogrande83.2%Aut.
BBH67.8%Aut.

Math

MATH20.8%Aut.

Reasoning

HellaSwag88.2%Aut.
MuSR50.7%Aut.

Indices d'évaluation AA

Intelligence Index
10.6
Mmlu Pro
0.6
Math 500
0.5
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Hle
0.0
Aime
0.0

Scores par catégorie LLM Stats

Communication
9
Creativity
9
Roleplay
9
General
1
Reasoning
1
Instruction Following
80
Physics
80
Biology
70
Chemistry
70
Language
70
Finance
60
Healthcare
60
Legal
60
Math
50

Tarification

Prix d'entrée$0.3 / 1M tokens
Prix de sortie$0.3 / 1M tokens
Prix mixte (3:1)$0.3 / 1M tokens

Vitesse

Tokens/sec30.6 tokens/s
Délai du premier token0.46s
Temps de réponse0.46s

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes