Claude 4 Sonnet (Reasoning)

AnthropicClaude

Date de sortie

2025-05-22

Paramètres

—

Longueur du contexte

1.0M

Modalités

image, pdf, text

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement codage	92	68.0	AA
Classement général	102	64.0	AA
Raisonnement mathématique	83	81.0	AA
Science	153	54.0	AA

Scores de benchmarks (LLM Stats)

Agents

Vending-Bench 2

801759.0%Aut.

GDPval-AA

1606.00 / 3000Aut.

DeepSearchQA

91.3%Aut.

BrowseComp

84.0%Aut.

CyberGym

73.8%Aut.

OSWorld

72.7%Aut.

Terminal-Bench 2.0

65.4%Aut.

MCP Atlas

62.7%Aut.

Finance Agent

60.7%Aut.

FrontierSWE

56.0%Aut.

OpenRCA

34.9%Aut.

Legal Agent Benchmark

4.2%Aut.

Biology

GPQA

91.3%Aut.

Code

SWE-Bench Verified

80.8%Aut.

SWE-bench Multilingual

77.8%Aut.

Communication

Tau2 Telecom

99.3%Aut.

Tau2 Retail

91.9%Aut.

General

MMMLU

91.1%Aut.

MMMU-Pro

77.3%Aut.

LiveBench

76.3%Aut.

MRCR v2 (8-needle)

76.0%Aut.

Healthcare

FigQA

78.3%Aut.

Long Context

Graphwalks parents >128k

95.4%Aut.

Graphwalks BFS >128k

61.5%Aut.

Math

AIME 2025

99.8%Aut.

Humanity's Last Exam

53.1%Aut.

Multimodal

CharXiv-R

77.4%Aut.

Reasoning

ARC-AGI v2

68.8%Aut.

Indices d'évaluation AA

Math Index

74.3

Intelligence Index

30.7

Math 500

1.0

Mmlu Pro

0.8

Gpqa

0.8

Aime

0.8

Aime 25

0.7

Livecodebench

0.7

Lcr

0.6

Tau2

0.6

Ifbench

0.5

Scicode

0.4

Terminalbench Hard

0.3

Hle

0.1

Scores par catégorie LLM Stats

Agents

100

Finance

100

Legal

100

Reasoning

100

General

100

Communication

100

Language

Physics

Biology

Chemistry

Long Context

Math

Multimodal

Safety

Spatial Reasoning

Frontend Development

Healthcare

Tool Calling

Code

Vision

Tarification

Prix d'entrée$3 / 1M tokens

Prix de sortie$15 / 1M tokens

Prix mixte (3:1)$6 / 1M tokens

Prix de lecture cache$0.5 / 1M tokens

Prix d'écriture cache$6.25 / 1M tokens

Vitesse

Tokens/sec0.0

Délai du premier token0.00s

Temps de réponse0.00s

Classement des Prix par Fournisseur

1 fournisseurs

FournisseurEntréeSortie

1AnthropicPRINCIPAL

$15

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

Artificial Analysis