Saltar al contenido principal

Claude 3 Opus

AnthropicClaudeProprietary

Descripción

Claude 3 Opus is Anthropic's most intelligent model, with best-in-market performance on highly complex tasks. It can navigate open-ended prompts and sight-unseen scenarios with remarkable fluency and human-like understanding, showing the outer limits of what's possible with generative AI.

Fecha de lanzamiento
2024-03-04
Parámetros
Longitud del contexto
Modalidades
image, text

Radar de capacidades

31
general
23
coding
31
reasoning
31
scienceest.
0
agents
80
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Code Ranking252
32.0
AA
General Ranking260
41.0
AA
Math Reasoning254
33.0
AA
Reasoning2
95.0
LS
Science358
30.0
AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA50.4%Aut.

Code

HumanEval84.9%Aut.

Finance

MMLU86.8%Aut.
MMLU-Pro68.5%Aut.

General

ARC-C96.4%Aut.

Language

BIG-Bench Hard86.8%Aut.

Math

GSM8k95.0%Aut.
MGSM90.7%Aut.
DROP83.1%Aut.
MATH60.1%Aut.

Reasoning

HellaSwag95.4%Aut.

Índices de evaluación AA

Coding Index
19.5
Intelligence Index
18.0
Mmlu Pro
0.7
Math 500
0.6
Gpqa
0.5
Livecodebench
0.3
Scicode
0.2
Aime
0.0
Hle
0.0

Puntuaciones por categoría LLM Stats

Code
80
Finance
80
General
80
Healthcare
80
Language
80
Legal
80
Math
80
Reasoning
80
Biology
50
Chemistry
50
Physics
50

Precios

Precio de entrada$18.75 / 1M tokens
Precio de salida$75 / 1M tokens
Precio mixto (3:1)$32.813 / 1M tokens

Velocidad

Tokens/seg0.0 tokens/s
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s

Proveedores disponibles

(Unidades internas LS)

No hay datos de proveedores disponibles

Fuentes externas