Passer au contenu principal

Claude 3.7 Sonnet (Reasoning)

AnthropicClaude
Date de sortie
2025-02-24
Paramètres
Longueur du contexte
200K
Modalités
file, image, text

Radar de capacités

46
general
36
coding
62
reasoning
51
scienceest.
0
agents
80
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Code Ranking137
52.0
AA
General Ranking134
61.0
AA
Math Reasoning144
63.0
AA
Science134
56.0
AA

Scores de benchmarks (LLM Stats)

Aucune donnée de benchmark disponible

Indices d'évaluation AA

Math Index
56.3
Intelligence Index
34.7
Coding Index
27.6
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.8
Lcr
0.6
Aime 25
0.6
Tau2
0.5
Aime
0.5
Ifbench
0.5
Livecodebench
0.5
Scicode
0.4
Terminalbench Hard
0.2
Hle
0.1

Scores par catégorie LLM Stats

Aucune donnée de score par catégorie disponible

Tarification

Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit

Vitesse

Tokens/sec0.0 tokens/s
Délai du premier token0.00s
Temps de réponse0.00s

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes

Aucun lien externe disponible