Claude 3.5 Sonnet

AnthropicClaudeProprietary

Description

Claude 3.5 Sonnet is a powerful AI model with industry-leading software engineering skills. It excels in coding, planning, and problem-solving, with significant improvements in agentic coding and tool use tasks. The model includes computer use capabilities in public beta, allowing it to interact with computer interfaces like a human user.

Date de sortie

2024-10-22

Paramètres

—

Longueur du contexte

200K

Modalités

image, pdf, text

Radar de capacités

general

coding

reasoning

scienceest.

agents

100

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Capacité agentique	121	18.0	LS
Classement multimodal	1	94.0	LS

Scores de benchmarks (LLM Stats)

Agents

OSWorld Extended

22.0%Aut.

OSWorld Screenshot-only

14.9%Aut.

Biology

GPQA

67.2%Aut.

Code

HumanEval

93.7%Aut.

SWE-Bench Verified

49.0%Aut.

Communication

TAU-bench Retail

69.2%Aut.

TAU-bench Airline

46.0%Aut.

Finance

MMLU

90.4%Aut.

MMLU-Pro

77.6%Aut.

General

MMMU

68.3%Aut.

Image To Text

DocVQA

95.2%Aut.

Language

BIG-Bench Hard

93.1%Aut.

Math

GSM8k

96.4%Aut.

MGSM

91.6%Aut.

DROP

87.1%Aut.

MATH

78.3%Aut.

MathVista

67.7%Aut.

Multimodal

AI2D

94.7%Aut.

ChartQA

90.8%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Image To Text

100

Language

Math

Legal

Multimodal

Reasoning

Finance

General

Healthcare

Vision

Physics

Biology

Chemistry

Code

Communication

Tool Calling

Frontend Development

Tarification

Prix d'entrée$3 / 1M tokens

Prix de sortie$15 / 1M tokens

Prix mixte (3:1)$6 / 1M tokens

Prix de lecture cache$0.3 / 1M tokens

Prix d'écriture cache$3.75 / 1M tokens

Vitesse

Aucune donnée de vitesse disponible

Classement des Prix par Fournisseur

2 fournisseurs

Moins cher: AnthropicPlus cher: LLM Gateway

FournisseurEntréeSortie

1AnthropicPRINCIPAL

$15

2LLM Gateway

$15

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

LLM Stats Artificial Analysis