Saltar al contenido principal

Llama 3.1 Nemotron Instruct 70B

NVIDIALlamaOpen WeightLlama 3.1 Community License

Descripción

A large language model customized by NVIDIA to improve the helpfulness of LLM generated responses. It is a fine-tuned version of Llama 3.1 70B Instruct. The model was trained using RLHF (REINFORCE) with HelpSteer2-Preference prompts.

Fecha de lanzamiento
2024-10-15
Parámetros
70.0B
Longitud del contexto
131K
Modalidades
text

Radar de capacidades

29
general
14
coding
27
reasoning
30
scienceest.
0
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Code Ranking391
14.0
AA
General Ranking355
31.0
AA
Math Reasoning282
26.0
AA
Reasoning18
86.0
LS
Science346
31.0
AA

Puntuaciones de benchmarks (LLM Stats)

Communication

MT-Bench0.09 / 100Aut.

Finance

MMLU Chat80.6%Aut.
MMLU80.2%Aut.
TruthfulQA58.6%Aut.

General

Instruct HumanEval73.8%Aut.
ARC-C69.2%Aut.

Language

Winogrande84.5%Aut.
XLSum English31.6%Aut.

Math

GSM8k91.4%Aut.
GSM8K Chat81.9%Aut.

Reasoning

HellaSwag85.6%Aut.

Índices de evaluación AA

Intelligence Index
13.4
Math Index
11.0
Coding Index
10.8
Math 500
0.7
Mmlu Pro
0.7
Gpqa
0.5
Ifbench
0.3
Aime
0.2
Scicode
0.2
Tau2
0.2
Livecodebench
0.2
Aime 25
0.1
Lcr
0.1
Hle
0.0
Terminalbench Hard
0.0

Puntuaciones por categoría LLM Stats

Math
90
Language
80
Finance
70
Healthcare
70
Legal
70
Reasoning
70
General
50
Communication
10
Creativity
10
Roleplay
10

Precios

Precio de entrada$1.2 / 1M tokens
Precio de salida$1.2 / 1M tokens
Precio mixto (3:1)$1.2 / 1M tokens

Velocidad

Tokens/seg38.1 tokens/s
Retraso del primer token0.34s
Tiempo hasta la respuesta0.34s

Proveedores disponibles

(Unidades internas LS)

No hay datos de proveedores disponibles

Fuentes externas