Hermes 3 - Llama-3.1 70B
Nous ResearchLlamaOpen WeightApache 2.0 · Commercial OK
Descripción
Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.
Fecha de lanzamiento
2024-08-15
Parámetros
70.0B
Longitud del contexto
131K
Modalidades
text
Radar de capacidades
24
general
20
coding
25
reasoning
27
scienceest.
0
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Code Ranking | 347 | 20.0 | AA |
| General Ranking | 382 | 28.0 | AA |
| Math Reasoning | 279 | 27.0 | AA |
| Reasoning | 43 | 70.0 | LS |
| Science | 381 | 27.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Biology
GPQA
66.1%Aut.
Communication
MT-Bench
8.99 / 100Aut.
Finance
MMLU
79.1%Aut.
TruthfulQA
63.3%Aut.
MMLU-Pro
47.2%Aut.
General
PIQA
84.4%Aut.
ARC-E
83.0%Aut.
IFBench
81.2%Aut.
ARC-C
65.5%Aut.
AGIEval
56.2%Aut.
OpenBookQA
49.4%Aut.
Language
BoolQ
88.0%Aut.
Winogrande
83.2%Aut.
BBH
67.8%Aut.
Math
MATH
20.8%Aut.
Reasoning
HellaSwag
88.2%Aut.
MuSR
50.7%Aut.
Índices de evaluación AA
Intelligence Index10.6
Mmlu Pro0.6
Math 5000.5
Gpqa0.4
Scicode0.2
Livecodebench0.2
Hle0.0
Aime0.0
Puntuaciones por categoría LLM Stats
Communication9
Creativity9
Roleplay9
General1
Reasoning1
Instruction Following80
Physics80
Biology70
Chemistry70
Language70
Finance60
Healthcare60
Legal60
Math50
Precios
Precio de entrada$0.3 / 1M tokens
Precio de salida$0.3 / 1M tokens
Precio mixto (3:1)$0.3 / 1M tokens
Velocidad
Tokens/seg30.6 tokens/s
Retraso del primer token0.46s
Tiempo hasta la respuesta0.46s
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles