Llama 3.1 Instruct 405B

MetaLlamaОткрытые весаLlama 3.1 Community License

Описание

Llama 3.1 405B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks. The model supports 8 languages and has a 128K token context length.

Дата выхода

2024-07-23

Параметры

405.0B

Длина контекста

—

Модальности

text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	323	25.0	AA
Общий рейтинг	327	33.0	AA
Математическое мышление	303	20.0	AA
Рассуждения	5	92.0	LS
Наука	318	35.0	AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA

50.7%Сам.

Code

HumanEval

89.0%Сам.

Gorilla Benchmark API Bench

35.3%Сам.

Finance

MMLU (CoT)

88.6%Сам.

MMLU

87.3%Сам.

MMLU-Pro

73.3%Сам.

General

ARC-C

96.9%Сам.

MBPP EvalPlus

88.6%Сам.

IFEval

88.6%Сам.

BFCL

88.5%Сам.

Multipl-E HumanEval

75.2%Сам.

Multipl-E MBPP

65.7%Сам.

Nexus

58.7%Сам.

Math

GSM8k

96.8%Сам.

Multilingual MGSM (CoT)

91.6%Сам.

DROP

84.8%Сам.

MATH

73.8%Сам.

Reasoning

API-Bank

92.0%Сам.

Индексы оценки AA

Intelligence Index

8.5

Math Index

3.0

Mmlu Pro

0.7

Math 500

0.7

Gpqa

0.5

Ifbench

0.4

Livecodebench

0.3

Scicode

0.3

Lcr

0.2

Aime

0.2

Tau2

0.2

Terminalbench Hard

0.1

Hle

0.0

Aime 25

0.0

Оценки категорий LLM Stats

Instruction Following

Math

Structured Output

Language

Legal

Reasoning

Finance

General

Healthcare

Tool Calling

Code

Physics

Biology

Chemistry

Цены

Цена ввода$2.75 / 1M токенов

Цена вывода$6.5 / 1M токенов

Смешанная цена (3:1)$3.688 / 1M токенов

Скорость

Токенов/сек60.6

Задержка первого токена0.68s

Время до первого ответа0.68s

Рейтинг цен провайдеров

7 провайдеров

Самый дешевый: Kilo GatewayСамый дорогой: Azure

ПровайдерВводВывод

1Kilo GatewayСамый дешевый

2Venice AI

$1.1

3MetaОсновной

$2.75

$6.5

4Synthetic

5Abacus

$3.5

6Azure Cognitive Services

$5.33

$16

7Azure

$5.33

$16

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis