Saltar al contenido principal

Hermes 3 - Llama-3.1 70B

Nous ResearchLlamaOpen WeightApache 2.0 · Uso Comercial

Descripción

Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.

Fecha de lanzamiento
2024-08-15
Parámetros
70.0B
Longitud del contexto
131K
Modalidades
text

Radar de capacidades

21
general
20
coding
25
reasoning
27
scienceest.
24
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking de codificación371
20.0
AA
Ranking general413
25.0
AA
Razonamiento matemático279
27.0
AA
Razonamiento48
70.0
LS
Ciencia401
27.0
AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA66.1%Aut.

Communication

MT-Bench8.99 / 100Aut.

Finance

MMLU79.1%Aut.
TruthfulQA63.3%Aut.
MMLU-Pro47.2%Aut.

General

PIQA84.4%Aut.
ARC-E83.0%Aut.
IFBench81.2%Aut.
ARC-C65.5%Aut.
AGIEval56.2%Aut.
OpenBookQA49.4%Aut.

Language

BoolQ88.0%Aut.
Winogrande83.2%Aut.
BBH67.8%Aut.

Math

MATH20.8%Aut.

Reasoning

HellaSwag88.2%Aut.
MuSR50.7%Aut.

Índices de evaluación AA

Intelligence Index
5.1
Mmlu Pro
0.6
Math 500
0.5
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Hle
0.0
Aime
0.0

Puntuaciones por categoría LLM Stats

Roleplay
9
Communication
9
Creativity
9
General
1
Reasoning
1
Physics
80
Instruction Following
80
Language
70
Biology
70
Chemistry
70
Legal
60
Finance
60
Healthcare
60
Math
50

Precios

Precio de entrada$0.3 / 1M tokens
Precio de salida$0.3 / 1M tokens
Precio mixto (3:1)$0.3 / 1M tokens

Velocidad

Tokens/seg31.8
Retraso del primer token0.35s
Tiempo hasta la respuesta0.35s

Ranking de Precios por Proveedor

Ranking de Precios por Proveedor

4 proveedores

Más barato: Nous ResearchMás caro: OpenRouter
ProveedorEntradaSalida
1Nous ResearchPRINCIPAL
$0.3
$0.3
2Kilo Gateway
$0.3
$0.3
3NanoGPT
$0.408
$0.408
4OpenRouter
$0.7
$0.7

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas