Llama 3.1 Instruct 405B
MetaLlamaОткрытые весаLlama 3.1 Community License
Описание
Llama 3.1 405B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks. The model supports 8 languages and has a 128K token context length.
Дата выхода
2024-07-23
Параметры
405.0B
Длина контекста
—
Модальности
text
Радар способностей
27
general
30
coding
23
reasoning
34
scienceоцен.
70
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 323 | 25.0 | AA |
| Общий рейтинг | 327 | 33.0 | AA |
| Математическое мышление | 303 | 20.0 | AA |
| Рассуждения | 5 | 92.0 | LS |
| Наука | 318 | 35.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
50.7%Сам.
Code
HumanEval
89.0%Сам.
Gorilla Benchmark API Bench
35.3%Сам.
Finance
MMLU (CoT)
88.6%Сам.
MMLU
87.3%Сам.
MMLU-Pro
73.3%Сам.
General
ARC-C
96.9%Сам.
MBPP EvalPlus
88.6%Сам.
IFEval
88.6%Сам.
BFCL
88.5%Сам.
Multipl-E HumanEval
75.2%Сам.
Multipl-E MBPP
65.7%Сам.
Nexus
58.7%Сам.
Math
GSM8k
96.8%Сам.
Multilingual MGSM (CoT)
91.6%Сам.
DROP
84.8%Сам.
MATH
73.8%Сам.
Reasoning
API-Bank
92.0%Сам.
Индексы оценки AA
Intelligence Index8.5
Math Index3.0
Mmlu Pro0.7
Math 5000.7
Gpqa0.5
Ifbench0.4
Livecodebench0.3
Scicode0.3
Lcr0.2
Aime0.2
Tau20.2
Terminalbench Hard0.1
Hle0.0
Aime 250.0
Оценки категорий LLM Stats
Instruction Following90
Math90
Structured Output90
Language80
Legal80
Reasoning80
Finance80
General80
Healthcare80
Tool Calling70
Code60
Physics50
Biology50
Chemistry50
Цены
Цена ввода$2.75 / 1M токенов
Цена вывода$6.5 / 1M токенов
Смешанная цена (3:1)$3.688 / 1M токенов
Скорость
Токенов/сек60.6
Задержка первого токена0.68s
Время до первого ответа0.68s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
7 провайдеров
Самый дешевый: Kilo GatewayСамый дорогой: Azure
ПровайдерВводВывод
1Kilo GatewayСамый дешевый
$1
$1
2Venice AI
$1.1
$3
3MetaОсновной
$2.75
$6.5
4Synthetic
$3
$3
5Abacus
$3.5
$3.5
6Azure Cognitive Services
$5.33
$16
7Azure
$5.33
$16
Сравнение цен разных API-провайдеров для этой модели.