Claude Opus 4
AnthropicClaudeProprietary
Description
Claude Opus 4 is Anthropic's most powerful model and the world's best coding model, part of the Claude 4 family. It delivers sustained performance on complex, long-running tasks and agent workflows. Opus 4 excels at coding, advanced reasoning, and can use tools (like web search) during extended thinking. It supports parallel tool execution and has improved memory capabilities.
Date de sortie
2025-05-22
Paramètres
—
Longueur du contexte
200K
Modalités
file, image, text
Radar de capacités
80
general
60
coding
80
reasoning
68
scienceest.
70
agents
80
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Agents & Tools | 88 | 39.0 | LS |
| Reasoning | 104 | 9.0 | LS |
Scores de benchmarks (LLM Stats)
Agents
Terminal-Bench
39.2%Aut.
Biology
GPQA
79.6%Aut.
Code
SWE-Bench Verified
72.5%Aut.
Communication
TAU-bench Retail
81.4%Aut.
TAU-bench Airline
59.6%Aut.
General
MMMLU
88.8%Aut.
MMMU (validation)
76.5%Aut.
Math
AIME 2025
75.5%Aut.
Reasoning
ARC-AGI v2
8.6%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Language90
Biology80
Chemistry80
General80
Healthcare80
Math80
Multimodal80
Physics80
Tool Calling70
Communication70
Frontend Development70
Code60
Reasoning60
Vision40
Agents40
Spatial Reasoning10
Tarification
Prix d'entrée$15 / 1M tokens
Prix de sortie$75 / 1M tokens
Prix mixte (3:1)$30 / 1M tokens
Vitesse
Aucune donnée de vitesse disponible
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible