Claude 3 Opus
AnthropicClaudeProprietary
Descripción
Claude 3 Opus is Anthropic's most intelligent model, with best-in-market performance on highly complex tasks. It can navigate open-ended prompts and sight-unseen scenarios with remarkable fluency and human-like understanding, showing the outer limits of what's possible with generative AI.
Fecha de lanzamiento
2024-03-04
Parámetros
—
Longitud del contexto
—
Modalidades
image, text
Radar de capacidades
31
general
23
coding
31
reasoning
31
scienceest.
0
agents
80
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Code Ranking | 252 | 32.0 | AA |
| General Ranking | 260 | 41.0 | AA |
| Math Reasoning | 254 | 33.0 | AA |
| Reasoning | 2 | 95.0 | LS |
| Science | 358 | 30.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Biology
GPQA
50.4%Aut.
Code
HumanEval
84.9%Aut.
Finance
MMLU
86.8%Aut.
MMLU-Pro
68.5%Aut.
General
ARC-C
96.4%Aut.
Language
BIG-Bench Hard
86.8%Aut.
Math
GSM8k
95.0%Aut.
MGSM
90.7%Aut.
DROP
83.1%Aut.
MATH
60.1%Aut.
Reasoning
HellaSwag
95.4%Aut.
Índices de evaluación AA
Coding Index19.5
Intelligence Index18.0
Mmlu Pro0.7
Math 5000.6
Gpqa0.5
Livecodebench0.3
Scicode0.2
Aime0.0
Hle0.0
Puntuaciones por categoría LLM Stats
Code80
Finance80
General80
Healthcare80
Language80
Legal80
Math80
Reasoning80
Biology50
Chemistry50
Physics50
Precios
Precio de entrada$18.75 / 1M tokens
Precio de salida$75 / 1M tokens
Precio mixto (3:1)$32.813 / 1M tokens
Velocidad
Tokens/seg0.0 tokens/s
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles