Llama 3.1 Instruct 8B
MetaLlamaOpen WeightLlama 3.1 Community License
Описание
Llama 3.1 8B Instruct is a multilingual large language model optimized for dialogue use cases. It features a 128K context length, state-of-the-art tool use, and strong reasoning capabilities.
Дата выхода
2024-07-23
Параметры
8.0B
Длина контекста
16K
Модальности
text
Радар способностей
22
general
8
coding
14
reasoning
17
scienceоцен.
50
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 420 | 10.0 | AA |
| General Ranking | 418 | 23.0 | AA |
| Math Reasoning | 324 | 14.0 | AA |
| Reasoning | 26 | 83.0 | LS |
| Science | 435 | 17.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
30.4%Сам.
Code
HumanEval
72.6%Сам.
Gorilla Benchmark API Bench
8.2%Сам.
Finance
MMLU (CoT)
73.0%Сам.
MMLU
69.4%Сам.
MMLU-Pro
48.3%Сам.
General
ARC-C
83.4%Сам.
IFEval
80.4%Сам.
BFCL
76.1%Сам.
MBPP EvalPlus (base)
72.8%Сам.
Multipl-E MBPP
52.4%Сам.
Multipl-E HumanEval
50.8%Сам.
Nexus
38.5%Сам.
Math
GSM-8K (CoT)
84.5%Сам.
Multilingual MGSM (CoT)
68.9%Сам.
DROP
59.5%Сам.
MATH (CoT)
51.9%Сам.
Reasoning
API-Bank
82.6%Сам.
Индексы оценки AA
Intelligence Index11.8
Coding Index4.9
Math Index4.3
Math 5000.5
Mmlu Pro0.5
Ifbench0.3
Gpqa0.3
Tau20.2
Lcr0.2
Scicode0.1
Livecodebench0.1
Aime0.1
Hle0.1
Aime 250.0
Terminalbench Hard0.0
Оценки категорий LLM Stats
Structured Output80
Instruction Following80
Finance60
General60
Healthcare60
Language60
Legal60
Math60
Reasoning60
Tool Calling50
Code40
Biology30
Chemistry30
Physics30
Цены
Цена ввода$0.1 / 1M tokens
Цена вывода$0.1 / 1M tokens
Смешанная цена (3:1)$0.1 / 1M tokens
Скорость
Токенов/сек188.5 tokens/s
Задержка первого токена0.47s
Время до первого ответа0.47s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров