Saltar al contenido principal

Claude 3.5 Sonnet (Oct '24)

AnthropicClaude
Fecha de lanzamiento
2024-10-22
Parámetros
Longitud del contexto
Modalidades

Radar de capacidades

32
general
34
coding
43
reasoning
41
scienceest.
0
agents
80
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Code Ranking165
48.0
AA
General Ranking248
42.0
AA
Math Reasoning197
46.0
AA
Science256
42.0
AA

Puntuaciones de benchmarks (LLM Stats)

No hay datos de benchmarks disponibles

Índices de evaluación AA

Coding Index
30.2
Intelligence Index
15.9
Mmlu Pro
0.8
Math 500
0.8
Gpqa
0.6
Livecodebench
0.4
Scicode
0.4
Aime
0.2
Hle
0.0

Puntuaciones por categoría LLM Stats

No hay datos de puntuación por categoría disponibles

Precios

Precio de entrada$3.75 / 1M tokens
Precio de salida$15 / 1M tokens
Precio mixto (3:1)$6.563 / 1M tokens

Velocidad

Tokens/seg0.0 tokens/s
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s

Proveedores disponibles

(Unidades internas LS)

No hay datos de proveedores disponibles

Fuentes externas

No hay enlaces externos disponibles