Перейти к основному содержанию

Llama 3.1 Nemotron Instruct 70B

NVIDIALlamaOpen WeightLlama 3.1 Community License

Описание

A large language model customized by NVIDIA to improve the helpfulness of LLM generated responses. It is a fine-tuned version of Llama 3.1 70B Instruct. The model was trained using RLHF (REINFORCE) with HelpSteer2-Preference prompts.

Дата выхода
2024-10-15
Параметры
70.0B
Длина контекста
131K
Модальности
text

Радар способностей

29
general
14
coding
27
reasoning
30
scienceоцен.
0
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Code Ranking391
14.0
AA
General Ranking355
31.0
AA
Math Reasoning282
26.0
AA
Reasoning18
86.0
LS
Science346
31.0
AA

Оценки бенчмарков (LLM Stats)

Communication

MT-Bench0.09 / 100Сам.

Finance

MMLU Chat80.6%Сам.
MMLU80.2%Сам.
TruthfulQA58.6%Сам.

General

Instruct HumanEval73.8%Сам.
ARC-C69.2%Сам.

Language

Winogrande84.5%Сам.
XLSum English31.6%Сам.

Math

GSM8k91.4%Сам.
GSM8K Chat81.9%Сам.

Reasoning

HellaSwag85.6%Сам.

Индексы оценки AA

Intelligence Index
13.4
Math Index
11.0
Coding Index
10.8
Math 500
0.7
Mmlu Pro
0.7
Gpqa
0.5
Ifbench
0.3
Aime
0.2
Scicode
0.2
Tau2
0.2
Livecodebench
0.2
Aime 25
0.1
Lcr
0.1
Hle
0.0
Terminalbench Hard
0.0

Оценки категорий LLM Stats

Math
90
Language
80
Finance
70
Healthcare
70
Legal
70
Reasoning
70
General
50
Communication
10
Creativity
10
Roleplay
10

Цены

Цена ввода$1.2 / 1M tokens
Цена вывода$1.2 / 1M tokens
Смешанная цена (3:1)$1.2 / 1M tokens

Скорость

Токенов/сек38.1 tokens/s
Задержка первого токена0.34s
Время до первого ответа0.34s

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки