Llama 3.1 Tulu3 405B

Allen Institute for AI

Date de sortie

2025-01-30

Paramètres

—

Longueur du contexte

—

Modalités

—

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement codage	279	32.0	AA
Classement général	323	34.0	AA
Raisonnement mathématique	199	46.0	AA
Science	326	35.0	AA

Scores de benchmarks (LLM Stats)

Aucune donnée de benchmark disponible

Indices d'évaluation AA

Intelligence Index

8.3

Math 500

0.8

Mmlu Pro

0.7

Gpqa

0.5

Scicode

0.3

Livecodebench

0.3

Aime

0.1

Hle

0.0

Scores par catégorie LLM Stats

Aucune donnée de score par catégorie disponible

Tarification

Prix d'entréeGratuit

Prix de sortieGratuit

Prix mixte (3:1)Gratuit

Vitesse

Tokens/sec0.0

Délai du premier token0.00s

Temps de réponse0.00s

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes

Artificial Analysis