Passer au contenu principal

Hermes 3 - Llama-3.1 70B

Nous ResearchLlamaOpen WeightApache 2.0 · Usage Commercial

Description

Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.

Date de sortie
2024-08-15
Paramètres
70.0B
Longueur du contexte
131K
Modalités
text

Radar de capacités

21
general
20
coding
25
reasoning
27
scienceest.
24
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement codage371
20.0
AA
Classement général413
25.0
AA
Raisonnement mathématique279
27.0
AA
Raisonnement48
70.0
LS
Science401
27.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA66.1%Aut.

Communication

MT-Bench8.99 / 100Aut.

Finance

MMLU79.1%Aut.
TruthfulQA63.3%Aut.
MMLU-Pro47.2%Aut.

General

PIQA84.4%Aut.
ARC-E83.0%Aut.
IFBench81.2%Aut.
ARC-C65.5%Aut.
AGIEval56.2%Aut.
OpenBookQA49.4%Aut.

Language

BoolQ88.0%Aut.
Winogrande83.2%Aut.
BBH67.8%Aut.

Math

MATH20.8%Aut.

Reasoning

HellaSwag88.2%Aut.
MuSR50.7%Aut.

Indices d'évaluation AA

Intelligence Index
5.1
Mmlu Pro
0.6
Math 500
0.5
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Hle
0.0
Aime
0.0

Scores par catégorie LLM Stats

Roleplay
9
Communication
9
Creativity
9
General
1
Reasoning
1
Instruction Following
80
Physics
80
Language
70
Biology
70
Chemistry
70
Legal
60
Finance
60
Healthcare
60
Math
50

Tarification

Prix d'entrée$0.3 / 1M tokens
Prix de sortie$0.3 / 1M tokens
Prix mixte (3:1)$0.3 / 1M tokens

Vitesse

Tokens/sec30.1
Délai du premier token0.35s
Temps de réponse0.35s

Classement des Prix par Fournisseur

Classement des Prix par Fournisseur

4 fournisseurs

Moins cher: Nous ResearchPlus cher: OpenRouter
FournisseurEntréeSortie
1Nous ResearchPRINCIPAL
$0.3
$0.3
2Kilo Gateway
$0.3
$0.3
3NanoGPT
$0.408
$0.408
4OpenRouter
$0.7
$0.7

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes