Llama 3.1 Instruct 70B
MetaLlamaOpen WeightLlama 3.1 Community License
Description
Llama 3.1 70B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks.
Date de sortie
2024-07-23
Paramètres
70.0B
Longueur du contexte
131K
Modalités
text
Radar de capacités
28
general
17
coding
20
reasoning
29
scienceest.
70
agents
0
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Code Ranking | 385 | 15.0 | AA |
| General Ranking | 367 | 30.0 | AA |
| Math Reasoning | 306 | 19.0 | AA |
| Reasoning | 10 | 90.0 | LS |
| Science | 357 | 30.0 | AA |
Scores de benchmarks (LLM Stats)
Biology
GPQA
41.7%Aut.
Code
HumanEval
80.5%Aut.
Gorilla Benchmark API Bench
29.7%Aut.
Finance
MMLU (CoT)
86.0%Aut.
MMLU
83.6%Aut.
MMLU-Pro
66.4%Aut.
General
ARC-C
94.8%Aut.
IFEval
87.5%Aut.
MBPP ++ base version
86.0%Aut.
BFCL
84.8%Aut.
Multipl-E HumanEval
65.5%Aut.
Multipl-E MBPP
62.0%Aut.
Nexus
56.7%Aut.
Math
GSM-8K (CoT)
95.1%Aut.
Multilingual MGSM (CoT)
86.9%Aut.
DROP
79.6%Aut.
MATH (CoT)
68.0%Aut.
Reasoning
API-Bank
90.0%Aut.
Indices d'évaluation AA
Intelligence Index12.5
Coding Index10.9
Math Index4.0
Mmlu Pro0.7
Math 5000.6
Gpqa0.4
Ifbench0.3
Scicode0.3
Livecodebench0.2
Aime0.2
Tau20.2
Lcr0.1
Hle0.0
Aime 250.0
Terminalbench Hard0.0
Scores par catégorie LLM Stats
Structured Output90
Instruction Following90
Finance80
Healthcare80
Language80
Legal80
Math80
Tool Calling70
General70
Reasoning70
Code60
Biology40
Chemistry40
Physics40
Tarification
Prix d'entrée$0.56 / 1M tokens
Prix de sortie$0.56 / 1M tokens
Prix mixte (3:1)$0.56 / 1M tokens
Vitesse
Tokens/sec33.0 tokens/s
Délai du premier token0.62s
Temps de réponse0.62s
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible