Llama 65B

MetaLlama

Date de sortie

2023-02-24

Paramètres

—

Longueur du contexte

131K

Modalités

text

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement général	532	2.0	AA

Scores de benchmarks (LLM Stats)

Biology

GPQA

50.5%Aut.

Code

HumanEval

88.4%Aut.

Finance

MMLU

86.0%Aut.

MMLU-Pro

68.9%Aut.

General

IFEval

92.1%Aut.

MBPP EvalPlus

87.6%Aut.

BFCL v2

77.3%Aut.

Math

MGSM

91.1%Aut.

MATH

77.0%Aut.

Indices d'évaluation AA

Intelligence Index

2.1

Scores par catégorie LLM Stats

Instruction Following

Structured Output

Code

Language

Legal

Math

Reasoning

Finance

Healthcare

Tool Calling

General

Physics

Biology

Chemistry

Tarification

Prix d'entréeGratuit

Prix de sortieGratuit

Prix mixte (3:1)Gratuit

Vitesse

Tokens/sec0.0

Délai du premier token0.00s

Temps de réponse0.00s

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes

Artificial Analysis