Hermes 3 - Llama-3.1 70B

Nous ResearchLlamaOpen WeightApache 2.0 · Uso Comercial

Descripción

Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.

Fecha de lanzamiento

2024-08-15

Parámetros

70.0B

Longitud del contexto

131K

Modalidades

text

Radar de capacidades

general

coding

reasoning

scienceest.

agents

multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio	#Posición	Puntuación	Fuente
Ranking de codificación	371	20.0	AA
Ranking general	413	25.0	AA
Razonamiento matemático	279	27.0	AA
Razonamiento	48	70.0	LS
Ciencia	401	27.0	AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA

66.1%Aut.

Communication

MT-Bench

8.99 / 100Aut.

Finance

MMLU

79.1%Aut.

TruthfulQA

63.3%Aut.

MMLU-Pro

47.2%Aut.

General

PIQA

84.4%Aut.

ARC-E

83.0%Aut.

IFBench

81.2%Aut.

ARC-C

65.5%Aut.

AGIEval

56.2%Aut.

OpenBookQA

49.4%Aut.

Language

BoolQ

88.0%Aut.

Winogrande

83.2%Aut.

BBH

67.8%Aut.

Math

MATH

20.8%Aut.

Reasoning

HellaSwag

88.2%Aut.

MuSR

50.7%Aut.

Índices de evaluación AA

Intelligence Index

5.1

Mmlu Pro

0.6

Math 500

0.5

Gpqa

0.4

Scicode

0.2

Livecodebench

0.2

Hle

0.0

Aime

0.0

Puntuaciones por categoría LLM Stats

Roleplay

Communication

Creativity

General

Reasoning

Physics

Instruction Following

Language

Biology

Chemistry

Legal

Finance

Healthcare

Math

Precios

Precio de entrada$0.3 / 1M tokens

Precio de salida$0.3 / 1M tokens

Precio mixto (3:1)$0.3 / 1M tokens

Velocidad

Tokens/seg31.8

Retraso del primer token0.35s

Tiempo hasta la respuesta0.35s

Ranking de Precios por Proveedor

4 proveedores

Más barato: Nous ResearchMás caro: OpenRouter

ProveedorEntradaSalida

1Nous ResearchPRINCIPAL

$0.3

2Kilo Gateway

$0.3

3NanoGPT

$0.408

4OpenRouter

$0.7

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas

LLM Stats Artificial Analysis