Llama 3.1 Instruct 8B
MetaLlamaOpen WeightLlama 3.1 Community License
Description
Llama 3.1 8B Instruct is a multilingual large language model optimized for dialogue use cases. It features a 128K context length, state-of-the-art tool use, and strong reasoning capabilities.
Date de sortie
2024-07-23
Paramètres
8.0B
Longueur du contexte
16K
Modalités
text
Radar de capacités
22
general
8
coding
14
reasoning
17
scienceest.
50
agents
0
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Code Ranking | 420 | 10.0 | AA |
| General Ranking | 418 | 23.0 | AA |
| Math Reasoning | 324 | 14.0 | AA |
| Reasoning | 26 | 83.0 | LS |
| Science | 435 | 17.0 | AA |
Scores de benchmarks (LLM Stats)
Biology
GPQA
30.4%Aut.
Code
HumanEval
72.6%Aut.
Gorilla Benchmark API Bench
8.2%Aut.
Finance
MMLU (CoT)
73.0%Aut.
MMLU
69.4%Aut.
MMLU-Pro
48.3%Aut.
General
ARC-C
83.4%Aut.
IFEval
80.4%Aut.
BFCL
76.1%Aut.
MBPP EvalPlus (base)
72.8%Aut.
Multipl-E MBPP
52.4%Aut.
Multipl-E HumanEval
50.8%Aut.
Nexus
38.5%Aut.
Math
GSM-8K (CoT)
84.5%Aut.
Multilingual MGSM (CoT)
68.9%Aut.
DROP
59.5%Aut.
MATH (CoT)
51.9%Aut.
Reasoning
API-Bank
82.6%Aut.
Indices d'évaluation AA
Intelligence Index11.8
Coding Index4.9
Math Index4.3
Math 5000.5
Mmlu Pro0.5
Ifbench0.3
Gpqa0.3
Tau20.2
Lcr0.2
Scicode0.1
Livecodebench0.1
Aime0.1
Hle0.1
Aime 250.0
Terminalbench Hard0.0
Scores par catégorie LLM Stats
Structured Output80
Instruction Following80
Finance60
General60
Healthcare60
Language60
Legal60
Math60
Reasoning60
Tool Calling50
Code40
Biology30
Chemistry30
Physics30
Tarification
Prix d'entrée$0.1 / 1M tokens
Prix de sortie$0.1 / 1M tokens
Prix mixte (3:1)$0.1 / 1M tokens
Vitesse
Tokens/sec188.5 tokens/s
Délai du premier token0.47s
Temps de réponse0.47s
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible