Claude 3 Opus
AnthropicClaudeProprietary
Description
Claude 3 Opus is Anthropic's most intelligent model, with best-in-market performance on highly complex tasks. It can navigate open-ended prompts and sight-unseen scenarios with remarkable fluency and human-like understanding, showing the outer limits of what's possible with generative AI.
Date de sortie
2024-03-04
Paramètres
—
Longueur du contexte
—
Modalités
image, text
Radar de capacités
31
general
23
coding
31
reasoning
31
scienceest.
0
agents
80
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Code Ranking | 252 | 32.0 | AA |
| General Ranking | 260 | 41.0 | AA |
| Math Reasoning | 254 | 33.0 | AA |
| Reasoning | 2 | 95.0 | LS |
| Science | 358 | 30.0 | AA |
Scores de benchmarks (LLM Stats)
Biology
GPQA
50.4%Aut.
Code
HumanEval
84.9%Aut.
Finance
MMLU
86.8%Aut.
MMLU-Pro
68.5%Aut.
General
ARC-C
96.4%Aut.
Language
BIG-Bench Hard
86.8%Aut.
Math
GSM8k
95.0%Aut.
MGSM
90.7%Aut.
DROP
83.1%Aut.
MATH
60.1%Aut.
Reasoning
HellaSwag
95.4%Aut.
Indices d'évaluation AA
Coding Index19.5
Intelligence Index18.0
Mmlu Pro0.7
Math 5000.6
Gpqa0.5
Livecodebench0.3
Scicode0.2
Aime0.0
Hle0.0
Scores par catégorie LLM Stats
Code80
Finance80
General80
Healthcare80
Language80
Legal80
Math80
Reasoning80
Biology50
Chemistry50
Physics50
Tarification
Prix d'entrée$18.75 / 1M tokens
Prix de sortie$75 / 1M tokens
Prix mixte (3:1)$32.813 / 1M tokens
Vitesse
Tokens/sec0.0 tokens/s
Délai du premier token0.00s
Temps de réponse0.00s
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible