Llama 3.1 Nemotron Instruct 70B

NVIDIALlamaОткрытые весаLlama 3.1 Community License

Описание

A large language model customized by NVIDIA to improve the helpfulness of LLM generated responses. It is a fine-tuned version of Llama 3.1 70B Instruct. The model was trained using RLHF (REINFORCE) with HelpSteer2-Preference prompts.

Дата выхода

2024-10-15

Параметры

70.0B

Длина контекста

—

Модальности

—

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	436	11.0	AA
Общий рейтинг	378	29.0	AA
Математическое мышление	282	26.0	AA
Рассуждения	18	86.0	LS
Наука	373	30.0	AA

Оценки бенчмарков (LLM Stats)

Communication

MT-Bench

0.09 / 100Сам.

Finance

MMLU Chat

80.6%Сам.

MMLU

80.2%Сам.

TruthfulQA

58.6%Сам.

General

Instruct HumanEval

73.8%Сам.

ARC-C

69.2%Сам.

Language

Winogrande

84.5%Сам.

XLSum English

31.6%Сам.

Math

GSM8k

91.4%Сам.

GSM8K Chat

81.9%Сам.

Reasoning

HellaSwag

85.6%Сам.

Индексы оценки AA

Math Index

11.0

Intelligence Index

7.6

Math 500

0.7

Mmlu Pro

0.7

Gpqa

0.5

Ifbench

0.3

Aime

0.2

Scicode

0.2

Tau2

0.2

Livecodebench

0.2

Aime 25

0.1

Lcr

0.1

Hle

0.0

Terminalbench Hard

0.0

Оценки категорий LLM Stats

Math

Language

Legal

Reasoning

Finance

Healthcare

General

Roleplay

Communication

Creativity

Цены

Цена ввода$1.2 / 1M токенов

Цена вывода$1.2 / 1M токенов

Смешанная цена (3:1)$1.2 / 1M токенов

Скорость

Токенов/сек295.6

Задержка первого токена4.91s

Время до первого ответа4.91s

Рейтинг цен провайдеров

2 провайдеров

Самый дешевый: NanoGPTСамый дорогой: NVIDIA

ПровайдерВводВывод

1NanoGPTСамый дешевый

$0.357

$0.408

2NVIDIAОсновной

$1.2

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis