Llama 3.1 Instruct 70B
MetaLlamaOpen WeightLlama 3.1 Community License
Descripción
Llama 3.1 70B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks.
Fecha de lanzamiento
2024-07-23
Parámetros
70.0B
Longitud del contexto
131K
Modalidades
text
Radar de capacidades
28
general
17
coding
20
reasoning
29
scienceest.
70
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Code Ranking | 385 | 15.0 | AA |
| General Ranking | 367 | 30.0 | AA |
| Math Reasoning | 306 | 19.0 | AA |
| Reasoning | 10 | 90.0 | LS |
| Science | 357 | 30.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Biology
GPQA
41.7%Aut.
Code
HumanEval
80.5%Aut.
Gorilla Benchmark API Bench
29.7%Aut.
Finance
MMLU (CoT)
86.0%Aut.
MMLU
83.6%Aut.
MMLU-Pro
66.4%Aut.
General
ARC-C
94.8%Aut.
IFEval
87.5%Aut.
MBPP ++ base version
86.0%Aut.
BFCL
84.8%Aut.
Multipl-E HumanEval
65.5%Aut.
Multipl-E MBPP
62.0%Aut.
Nexus
56.7%Aut.
Math
GSM-8K (CoT)
95.1%Aut.
Multilingual MGSM (CoT)
86.9%Aut.
DROP
79.6%Aut.
MATH (CoT)
68.0%Aut.
Reasoning
API-Bank
90.0%Aut.
Índices de evaluación AA
Intelligence Index12.5
Coding Index10.9
Math Index4.0
Mmlu Pro0.7
Math 5000.6
Gpqa0.4
Ifbench0.3
Scicode0.3
Livecodebench0.2
Aime0.2
Tau20.2
Lcr0.1
Hle0.0
Aime 250.0
Terminalbench Hard0.0
Puntuaciones por categoría LLM Stats
Structured Output90
Instruction Following90
Finance80
Healthcare80
Language80
Legal80
Math80
Tool Calling70
General70
Reasoning70
Code60
Biology40
Chemistry40
Physics40
Precios
Precio de entrada$0.56 / 1M tokens
Precio de salida$0.56 / 1M tokens
Precio mixto (3:1)$0.56 / 1M tokens
Velocidad
Tokens/seg33.0 tokens/s
Retraso del primer token0.62s
Tiempo hasta la respuesta0.62s
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles