Passer au contenu principal

Llama 3.1 Instruct 405B

MetaLlamaOpen WeightLlama 3.1 Community License

Description

Llama 3.1 405B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks. The model supports 8 languages and has a 128K token context length.

Date de sortie
2024-07-23
Paramètres
405.0B
Longueur du contexte
Modalités
text

Radar de capacités

32
general
22
coding
23
reasoning
34
scienceest.
70
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Code Ranking296
25.0
AA
General Ranking289
37.0
AA
Math Reasoning303
20.0
AA
Reasoning5
92.0
LS
Science293
36.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA50.7%Aut.

Code

HumanEval89.0%Aut.
Gorilla Benchmark API Bench35.3%Aut.

Finance

MMLU (CoT)88.6%Aut.
MMLU87.3%Aut.
MMLU-Pro73.3%Aut.

General

ARC-C96.9%Aut.
MBPP EvalPlus88.6%Aut.
IFEval88.6%Aut.
BFCL88.5%Aut.
Multipl-E HumanEval75.2%Aut.
Multipl-E MBPP65.7%Aut.
Nexus58.7%Aut.

Math

GSM8k96.8%Aut.
Multilingual MGSM (CoT)91.6%Aut.
DROP84.8%Aut.
MATH73.8%Aut.

Reasoning

API-Bank92.0%Aut.

Indices d'évaluation AA

Intelligence Index
17.4
Coding Index
14.5
Math Index
3.0
Mmlu Pro
0.7
Math 500
0.7
Gpqa
0.5
Ifbench
0.4
Livecodebench
0.3
Scicode
0.3
Lcr
0.2
Aime
0.2
Tau2
0.2
Terminalbench Hard
0.1
Hle
0.0
Aime 25
0.0

Scores par catégorie LLM Stats

Structured Output
90
Instruction Following
90
Math
90
Finance
80
General
80
Healthcare
80
Language
80
Legal
80
Reasoning
80
Tool Calling
70
Code
60
Biology
50
Chemistry
50
Physics
50

Tarification

Prix d'entrée$2.75 / 1M tokens
Prix de sortie$6.5 / 1M tokens
Prix mixte (3:1)$3.688 / 1M tokens

Vitesse

Tokens/sec31.5 tokens/s
Délai du premier token0.69s
Temps de réponse0.69s

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes