Hermes 3 - Llama-3.1 70B
Nous ResearchLlamaOpen WeightApache 2.0 · Usage Commercial
Description
Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.
Date de sortie
2024-08-15
Paramètres
70.0B
Longueur du contexte
131K
Modalités
text
Radar de capacités
21
general
20
coding
25
reasoning
27
scienceest.
24
agents
0
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Classement codage | 371 | 20.0 | AA |
| Classement général | 413 | 25.0 | AA |
| Raisonnement mathématique | 279 | 27.0 | AA |
| Raisonnement | 48 | 70.0 | LS |
| Science | 401 | 27.0 | AA |
Scores de benchmarks (LLM Stats)
Biology
GPQA
66.1%Aut.
Communication
MT-Bench
8.99 / 100Aut.
Finance
MMLU
79.1%Aut.
TruthfulQA
63.3%Aut.
MMLU-Pro
47.2%Aut.
General
PIQA
84.4%Aut.
ARC-E
83.0%Aut.
IFBench
81.2%Aut.
ARC-C
65.5%Aut.
AGIEval
56.2%Aut.
OpenBookQA
49.4%Aut.
Language
BoolQ
88.0%Aut.
Winogrande
83.2%Aut.
BBH
67.8%Aut.
Math
MATH
20.8%Aut.
Reasoning
HellaSwag
88.2%Aut.
MuSR
50.7%Aut.
Indices d'évaluation AA
Intelligence Index5.1
Mmlu Pro0.6
Math 5000.5
Gpqa0.4
Scicode0.2
Livecodebench0.2
Hle0.0
Aime0.0
Scores par catégorie LLM Stats
Roleplay9
Communication9
Creativity9
General1
Reasoning1
Instruction Following80
Physics80
Language70
Biology70
Chemistry70
Legal60
Finance60
Healthcare60
Math50
Tarification
Prix d'entrée$0.3 / 1M tokens
Prix de sortie$0.3 / 1M tokens
Prix mixte (3:1)$0.3 / 1M tokens
Vitesse
Tokens/sec30.1
Délai du premier token0.35s
Temps de réponse0.35s
Classement des Prix par Fournisseur
Classement des Prix par Fournisseur
4 fournisseurs
Moins cher: Nous ResearchPlus cher: OpenRouter
FournisseurEntréeSortie
1Nous ResearchPRINCIPAL
$0.3
$0.3
2Kilo Gateway
$0.3
$0.3
3NanoGPT
$0.408
$0.408
4OpenRouter
$0.7
$0.7
Comparer les prix entre différents fournisseurs API pour ce modèle.