Passer au contenu principal

Llama 3.1 Nemotron Instruct 70B

NVIDIALlamaOpen WeightLlama 3.1 Community License

Description

A large language model customized by NVIDIA to improve the helpfulness of LLM generated responses. It is a fine-tuned version of Llama 3.1 70B Instruct. The model was trained using RLHF (REINFORCE) with HelpSteer2-Preference prompts.

Date de sortie
2024-10-15
Paramètres
70.0B
Longueur du contexte
131K
Modalités
text

Radar de capacités

29
general
14
coding
27
reasoning
30
scienceest.
0
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Code Ranking391
14.0
AA
General Ranking355
31.0
AA
Math Reasoning282
26.0
AA
Reasoning18
86.0
LS
Science346
31.0
AA

Scores de benchmarks (LLM Stats)

Communication

MT-Bench0.09 / 100Aut.

Finance

MMLU Chat80.6%Aut.
MMLU80.2%Aut.
TruthfulQA58.6%Aut.

General

Instruct HumanEval73.8%Aut.
ARC-C69.2%Aut.

Language

Winogrande84.5%Aut.
XLSum English31.6%Aut.

Math

GSM8k91.4%Aut.
GSM8K Chat81.9%Aut.

Reasoning

HellaSwag85.6%Aut.

Indices d'évaluation AA

Intelligence Index
13.4
Math Index
11.0
Coding Index
10.8
Math 500
0.7
Mmlu Pro
0.7
Gpqa
0.5
Ifbench
0.3
Aime
0.2
Scicode
0.2
Tau2
0.2
Livecodebench
0.2
Aime 25
0.1
Lcr
0.1
Hle
0.0
Terminalbench Hard
0.0

Scores par catégorie LLM Stats

Math
90
Language
80
Finance
70
Healthcare
70
Legal
70
Reasoning
70
General
50
Communication
10
Creativity
10
Roleplay
10

Tarification

Prix d'entrée$1.2 / 1M tokens
Prix de sortie$1.2 / 1M tokens
Prix mixte (3:1)$1.2 / 1M tokens

Vitesse

Tokens/sec38.1 tokens/s
Délai du premier token0.34s
Temps de réponse0.34s

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes