Claude Opus 4
AnthropicClaudeProprietary
Descripción
Claude Opus 4 is Anthropic's most powerful model and the world's best coding model, part of the Claude 4 family. It delivers sustained performance on complex, long-running tasks and agent workflows. Opus 4 excels at coding, advanced reasoning, and can use tools (like web search) during extended thinking. It supports parallel tool execution and has improved memory capabilities.
Fecha de lanzamiento
2025-05-22
Parámetros
—
Longitud del contexto
200K
Modalidades
file, image, text
Radar de capacidades
80
general
60
coding
80
reasoning
68
scienceest.
70
agents
80
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Agents & Tools | 88 | 39.0 | LS |
| Reasoning | 104 | 9.0 | LS |
Puntuaciones de benchmarks (LLM Stats)
Agents
Terminal-Bench
39.2%Aut.
Biology
GPQA
79.6%Aut.
Code
SWE-Bench Verified
72.5%Aut.
Communication
TAU-bench Retail
81.4%Aut.
TAU-bench Airline
59.6%Aut.
General
MMMLU
88.8%Aut.
MMMU (validation)
76.5%Aut.
Math
AIME 2025
75.5%Aut.
Reasoning
ARC-AGI v2
8.6%Aut.
Índices de evaluación AA
No hay datos de evaluación AA disponibles
Puntuaciones por categoría LLM Stats
Language90
Biology80
Chemistry80
General80
Healthcare80
Math80
Multimodal80
Physics80
Tool Calling70
Communication70
Frontend Development70
Code60
Reasoning60
Vision40
Agents40
Spatial Reasoning10
Precios
Precio de entrada$15 / 1M tokens
Precio de salida$75 / 1M tokens
Precio mixto (3:1)$30 / 1M tokens
Velocidad
No hay datos de velocidad disponibles
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles