Llama 3.1 Instruct 405B
MetaLlamaOpen WeightLlama 3.1 Community License
Описание
Llama 3.1 405B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks. The model supports 8 languages and has a 128K token context length.
Дата выхода
2024-07-23
Параметры
405.0B
Длина контекста
—
Модальности
text
Радар способностей
32
general
22
coding
23
reasoning
34
scienceоцен.
70
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 296 | 25.0 | AA |
| General Ranking | 289 | 37.0 | AA |
| Math Reasoning | 303 | 20.0 | AA |
| Reasoning | 5 | 92.0 | LS |
| Science | 293 | 36.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
50.7%Сам.
Code
HumanEval
89.0%Сам.
Gorilla Benchmark API Bench
35.3%Сам.
Finance
MMLU (CoT)
88.6%Сам.
MMLU
87.3%Сам.
MMLU-Pro
73.3%Сам.
General
ARC-C
96.9%Сам.
MBPP EvalPlus
88.6%Сам.
IFEval
88.6%Сам.
BFCL
88.5%Сам.
Multipl-E HumanEval
75.2%Сам.
Multipl-E MBPP
65.7%Сам.
Nexus
58.7%Сам.
Math
GSM8k
96.8%Сам.
Multilingual MGSM (CoT)
91.6%Сам.
DROP
84.8%Сам.
MATH
73.8%Сам.
Reasoning
API-Bank
92.0%Сам.
Индексы оценки AA
Intelligence Index17.4
Coding Index14.5
Math Index3.0
Mmlu Pro0.7
Math 5000.7
Gpqa0.5
Ifbench0.4
Livecodebench0.3
Scicode0.3
Lcr0.2
Aime0.2
Tau20.2
Terminalbench Hard0.1
Hle0.0
Aime 250.0
Оценки категорий LLM Stats
Structured Output90
Instruction Following90
Math90
Finance80
General80
Healthcare80
Language80
Legal80
Reasoning80
Tool Calling70
Code60
Biology50
Chemistry50
Physics50
Цены
Цена ввода$2.75 / 1M tokens
Цена вывода$6.5 / 1M tokens
Смешанная цена (3:1)$3.688 / 1M tokens
Скорость
Токенов/сек31.5 tokens/s
Задержка первого токена0.69s
Время до первого ответа0.69s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров