Llama 3.1 Instruct 8B
MetaLlamaOpen WeightLlama 3.1 Community License
Descripción
Llama 3.1 8B Instruct is a multilingual large language model optimized for dialogue use cases. It features a 128K context length, state-of-the-art tool use, and strong reasoning capabilities.
Fecha de lanzamiento
2024-07-23
Parámetros
8.0B
Longitud del contexto
16K
Modalidades
text
Radar de capacidades
22
general
8
coding
14
reasoning
17
scienceest.
50
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Code Ranking | 420 | 10.0 | AA |
| General Ranking | 418 | 23.0 | AA |
| Math Reasoning | 324 | 14.0 | AA |
| Reasoning | 26 | 83.0 | LS |
| Science | 435 | 17.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Biology
GPQA
30.4%Aut.
Code
HumanEval
72.6%Aut.
Gorilla Benchmark API Bench
8.2%Aut.
Finance
MMLU (CoT)
73.0%Aut.
MMLU
69.4%Aut.
MMLU-Pro
48.3%Aut.
General
ARC-C
83.4%Aut.
IFEval
80.4%Aut.
BFCL
76.1%Aut.
MBPP EvalPlus (base)
72.8%Aut.
Multipl-E MBPP
52.4%Aut.
Multipl-E HumanEval
50.8%Aut.
Nexus
38.5%Aut.
Math
GSM-8K (CoT)
84.5%Aut.
Multilingual MGSM (CoT)
68.9%Aut.
DROP
59.5%Aut.
MATH (CoT)
51.9%Aut.
Reasoning
API-Bank
82.6%Aut.
Índices de evaluación AA
Intelligence Index11.8
Coding Index4.9
Math Index4.3
Math 5000.5
Mmlu Pro0.5
Ifbench0.3
Gpqa0.3
Tau20.2
Lcr0.2
Scicode0.1
Livecodebench0.1
Aime0.1
Hle0.1
Aime 250.0
Terminalbench Hard0.0
Puntuaciones por categoría LLM Stats
Structured Output80
Instruction Following80
Finance60
General60
Healthcare60
Language60
Legal60
Math60
Reasoning60
Tool Calling50
Code40
Biology30
Chemistry30
Physics30
Precios
Precio de entrada$0.1 / 1M tokens
Precio de salida$0.1 / 1M tokens
Precio mixto (3:1)$0.1 / 1M tokens
Velocidad
Tokens/seg188.5 tokens/s
Retraso del primer token0.47s
Tiempo hasta la respuesta0.47s
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles