Claude 4 Opus (Reasoning)
AnthropicClaude
Date de sortie
2025-05-22
Paramètres
—
Longueur du contexte
1.0M
Modalités
image, pdf, text
Radar de capacités
45
general
58
coding
78
reasoning
52
scienceest.
80
agents
80
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Classement codage | 163 | 54.0 | AA |
| Classement général | 95 | 66.0 | AA |
| Raisonnement mathématique | 85 | 80.0 | AA |
| Science | 136 | 56.0 | AA |
Scores de benchmarks (LLM Stats)
Agents
Vending-Bench 2
801759.0%Aut.
GDPval-AA
1606.00 / 3000Aut.
DeepSearchQA
91.3%Aut.
BrowseComp
84.0%Aut.
CyberGym
73.8%Aut.
OSWorld
72.7%Aut.
Terminal-Bench 2.0
65.4%Aut.
MCP Atlas
62.7%Aut.
Finance Agent
60.7%Aut.
FrontierSWE
56.0%Aut.
OpenRCA
34.9%Aut.
Legal Agent Benchmark
4.2%Aut.
Biology
GPQA
91.3%Aut.
Code
SWE-Bench Verified
80.8%Aut.
SWE-bench Multilingual
77.8%Aut.
Communication
Tau2 Telecom
99.3%Aut.
Tau2 Retail
91.9%Aut.
General
MMMLU
91.1%Aut.
MMMU-Pro
77.3%Aut.
LiveBench
76.3%Aut.
MRCR v2 (8-needle)
76.0%Aut.
Healthcare
FigQA
78.3%Aut.
Long Context
Graphwalks parents >128k
95.4%Aut.
Graphwalks BFS >128k
61.5%Aut.
Math
AIME 2025
99.8%Aut.
Humanity's Last Exam
53.1%Aut.
Multimodal
CharXiv-R
77.4%Aut.
Reasoning
ARC-AGI v2
68.8%Aut.
Indices d'évaluation AA
Math Index73.3
Intelligence Index31.0
Math 5001.0
Mmlu Pro0.9
Gpqa0.8
Aime0.8
Tau20.7
Aime 250.7
Livecodebench0.6
Ifbench0.5
Scicode0.4
Lcr0.3
Terminalbench Hard0.3
Hle0.1
Scores par catégorie LLM Stats
Agents100
Finance100
Legal100
Reasoning100
General100
Communication100
Language90
Physics90
Search90
Biology90
Chemistry90
Long Context80
Math80
Multimodal80
Safety80
Spatial Reasoning80
Frontend Development80
Healthcare80
Tool Calling80
Code70
Vision70
Tarification
Prix d'entrée$15 / 1M tokens
Prix de sortie$75 / 1M tokens
Prix mixte (3:1)$30 / 1M tokens
Prix de lecture cache$0.5 / 1M tokens
Prix d'écriture cache$6.25 / 1M tokens
Vitesse
Tokens/sec0.0
Délai du premier token0.00s
Temps de réponse0.00s
Classement des Prix par Fournisseur
Classement des Prix par Fournisseur
1 fournisseurs
FournisseurEntréeSortie
1AnthropicPRINCIPAL
$15
$75
Comparer les prix entre différents fournisseurs API pour ce modèle.