Claude 3.5 Sonnet (Oct '24)

AnthropicClaude

Descripción

Claude 3.5 Sonnet is a powerful AI model. It excels in graduate-level reasoning, undergraduate-level knowledge, and coding proficiency, with improved understanding of nuance, humor, and complex instructions.

Fecha de lanzamiento

2024-10-22

Parámetros

—

Longitud del contexto

200K

Modalidades

image, pdf, text

Radar de capacidades

general

coding

reasoning

scienceest.

agents

100

multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio	#Posición	Puntuación	Fuente
Ranking de codificación	240	40.0	AA
Ranking general	284	38.0	AA
Razonamiento matemático	197	46.0	AA
Ciencia	270	42.0	AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA

59.4%Aut.

Code

HumanEval

92.0%Aut.

Finance

MMLU

90.4%Aut.

MMLU-Pro

76.1%Aut.

Language

BIG-Bench Hard

93.1%Aut.

Math

GSM8k

96.4%Aut.

MGSM

91.6%Aut.

DROP

87.1%Aut.

MATH

71.1%Aut.

Índices de evaluación AA

Coding Index

30.2

Intelligence Index

9.9

Mmlu Pro

0.8

Math 500

0.8

Gpqa

0.6

Livecodebench

0.4

Scicode

0.4

Aime

0.2

Hle

0.0

Puntuaciones por categoría LLM Stats

Language

Math

Code

Legal

Reasoning

Finance

General

Healthcare

Physics

Biology

Chemistry

Precios

Precio de entrada$3 / 1M tokens

Precio de salida$15 / 1M tokens

Precio mixto (3:1)$6 / 1M tokens

Precio de lectura caché$0.3 / 1M tokens

Precio de escritura caché$3.75 / 1M tokens

Velocidad

Tokens/seg0.0

Retraso del primer token0.00s

Tiempo hasta la respuesta0.00s

Ranking de Precios por Proveedor

5 proveedores

Más barato: AnthropicMás caro: DigitalOcean

ProveedorEntradaSalida

1AnthropicPRINCIPAL

$15

2SAP AI Core

$15

3Cloudflare AI Gateway

$15

4Helicone

$15

5DigitalOcean

$15

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas

Artificial Analysis