Llama 3.1 Nemotron Instruct 70B
NVIDIALlamaOpen WeightLlama 3.1 Community License
Descripción
A large language model customized by NVIDIA to improve the helpfulness of LLM generated responses. It is a fine-tuned version of Llama 3.1 70B Instruct. The model was trained using RLHF (REINFORCE) with HelpSteer2-Preference prompts.
Fecha de lanzamiento
2024-10-15
Parámetros
70.0B
Longitud del contexto
131K
Modalidades
text
Radar de capacidades
29
general
14
coding
27
reasoning
30
scienceest.
0
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Code Ranking | 391 | 14.0 | AA |
| General Ranking | 355 | 31.0 | AA |
| Math Reasoning | 282 | 26.0 | AA |
| Reasoning | 18 | 86.0 | LS |
| Science | 346 | 31.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Communication
MT-Bench
0.09 / 100Aut.
Finance
MMLU Chat
80.6%Aut.
MMLU
80.2%Aut.
TruthfulQA
58.6%Aut.
General
Instruct HumanEval
73.8%Aut.
ARC-C
69.2%Aut.
Language
Winogrande
84.5%Aut.
XLSum English
31.6%Aut.
Math
GSM8k
91.4%Aut.
GSM8K Chat
81.9%Aut.
Reasoning
HellaSwag
85.6%Aut.
Índices de evaluación AA
Intelligence Index13.4
Math Index11.0
Coding Index10.8
Math 5000.7
Mmlu Pro0.7
Gpqa0.5
Ifbench0.3
Aime0.2
Scicode0.2
Tau20.2
Livecodebench0.2
Aime 250.1
Lcr0.1
Hle0.0
Terminalbench Hard0.0
Puntuaciones por categoría LLM Stats
Math90
Language80
Finance70
Healthcare70
Legal70
Reasoning70
General50
Communication10
Creativity10
Roleplay10
Precios
Precio de entrada$1.2 / 1M tokens
Precio de salida$1.2 / 1M tokens
Precio mixto (3:1)$1.2 / 1M tokens
Velocidad
Tokens/seg38.1 tokens/s
Retraso del primer token0.34s
Tiempo hasta la respuesta0.34s
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles