Llama 3.1 Instruct 70B
MetaLlamaOpen WeightLlama 3.1 Community License
Описание
Llama 3.1 70B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks.
Дата выхода
2024-07-23
Параметры
70.0B
Длина контекста
131K
Модальности
text
Радар способностей
28
general
17
coding
20
reasoning
29
scienceоцен.
70
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 385 | 15.0 | AA |
| General Ranking | 367 | 30.0 | AA |
| Math Reasoning | 306 | 19.0 | AA |
| Reasoning | 10 | 90.0 | LS |
| Science | 357 | 30.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
41.7%Сам.
Code
HumanEval
80.5%Сам.
Gorilla Benchmark API Bench
29.7%Сам.
Finance
MMLU (CoT)
86.0%Сам.
MMLU
83.6%Сам.
MMLU-Pro
66.4%Сам.
General
ARC-C
94.8%Сам.
IFEval
87.5%Сам.
MBPP ++ base version
86.0%Сам.
BFCL
84.8%Сам.
Multipl-E HumanEval
65.5%Сам.
Multipl-E MBPP
62.0%Сам.
Nexus
56.7%Сам.
Math
GSM-8K (CoT)
95.1%Сам.
Multilingual MGSM (CoT)
86.9%Сам.
DROP
79.6%Сам.
MATH (CoT)
68.0%Сам.
Reasoning
API-Bank
90.0%Сам.
Индексы оценки AA
Intelligence Index12.5
Coding Index10.9
Math Index4.0
Mmlu Pro0.7
Math 5000.6
Gpqa0.4
Ifbench0.3
Scicode0.3
Livecodebench0.2
Aime0.2
Tau20.2
Lcr0.1
Hle0.0
Aime 250.0
Terminalbench Hard0.0
Оценки категорий LLM Stats
Structured Output90
Instruction Following90
Finance80
Healthcare80
Language80
Legal80
Math80
Tool Calling70
General70
Reasoning70
Code60
Biology40
Chemistry40
Physics40
Цены
Цена ввода$0.56 / 1M tokens
Цена вывода$0.56 / 1M tokens
Смешанная цена (3:1)$0.56 / 1M tokens
Скорость
Токенов/сек33.0 tokens/s
Задержка первого токена0.62s
Время до первого ответа0.62s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров