Saltar al contenido principal

Hermes 3 - Llama-3.1 70B

Nous ResearchLlamaOpen WeightApache 2.0 · Commercial OK

Descripción

Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.

Fecha de lanzamiento
2024-08-15
Parámetros
70.0B
Longitud del contexto
131K
Modalidades
text

Radar de capacidades

24
general
20
coding
25
reasoning
27
scienceest.
0
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Code Ranking347
20.0
AA
General Ranking382
28.0
AA
Math Reasoning279
27.0
AA
Reasoning43
70.0
LS
Science381
27.0
AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA66.1%Aut.

Communication

MT-Bench8.99 / 100Aut.

Finance

MMLU79.1%Aut.
TruthfulQA63.3%Aut.
MMLU-Pro47.2%Aut.

General

PIQA84.4%Aut.
ARC-E83.0%Aut.
IFBench81.2%Aut.
ARC-C65.5%Aut.
AGIEval56.2%Aut.
OpenBookQA49.4%Aut.

Language

BoolQ88.0%Aut.
Winogrande83.2%Aut.
BBH67.8%Aut.

Math

MATH20.8%Aut.

Reasoning

HellaSwag88.2%Aut.
MuSR50.7%Aut.

Índices de evaluación AA

Intelligence Index
10.6
Mmlu Pro
0.6
Math 500
0.5
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Hle
0.0
Aime
0.0

Puntuaciones por categoría LLM Stats

Communication
9
Creativity
9
Roleplay
9
General
1
Reasoning
1
Instruction Following
80
Physics
80
Biology
70
Chemistry
70
Language
70
Finance
60
Healthcare
60
Legal
60
Math
50

Precios

Precio de entrada$0.3 / 1M tokens
Precio de salida$0.3 / 1M tokens
Precio mixto (3:1)$0.3 / 1M tokens

Velocidad

Tokens/seg30.6 tokens/s
Retraso del primer token0.46s
Tiempo hasta la respuesta0.46s

Proveedores disponibles

(Unidades internas LS)

No hay datos de proveedores disponibles

Fuentes externas