Passer au contenu principal

Claude 3 Opus

AnthropicClaudeProprietary

Description

Claude 3 Opus is Anthropic's most intelligent model, with best-in-market performance on highly complex tasks. It can navigate open-ended prompts and sight-unseen scenarios with remarkable fluency and human-like understanding, showing the outer limits of what's possible with generative AI.

Date de sortie
2024-03-04
Paramètres
Longueur du contexte
Modalités
image, text

Radar de capacités

31
general
23
coding
31
reasoning
31
scienceest.
0
agents
80
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Code Ranking252
32.0
AA
General Ranking260
41.0
AA
Math Reasoning254
33.0
AA
Reasoning2
95.0
LS
Science358
30.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA50.4%Aut.

Code

HumanEval84.9%Aut.

Finance

MMLU86.8%Aut.
MMLU-Pro68.5%Aut.

General

ARC-C96.4%Aut.

Language

BIG-Bench Hard86.8%Aut.

Math

GSM8k95.0%Aut.
MGSM90.7%Aut.
DROP83.1%Aut.
MATH60.1%Aut.

Reasoning

HellaSwag95.4%Aut.

Indices d'évaluation AA

Coding Index
19.5
Intelligence Index
18.0
Mmlu Pro
0.7
Math 500
0.6
Gpqa
0.5
Livecodebench
0.3
Scicode
0.2
Aime
0.0
Hle
0.0

Scores par catégorie LLM Stats

Code
80
Finance
80
General
80
Healthcare
80
Language
80
Legal
80
Math
80
Reasoning
80
Biology
50
Chemistry
50
Physics
50

Tarification

Prix d'entrée$18.75 / 1M tokens
Prix de sortie$75 / 1M tokens
Prix mixte (3:1)$32.813 / 1M tokens

Vitesse

Tokens/sec0.0 tokens/s
Délai du premier token0.00s
Temps de réponse0.00s

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes