メインコンテンツへスキップ

Claude 3.7 Sonnet (Reasoning)

AnthropicClaude

説明

The most intelligent Claude model and the first hybrid reasoning model on the market. Claude 3.7 Sonnet can produce near-instant responses or extended, step-by-step thinking that is made visible to the user. Shows particularly strong improvements in coding and front-end web development.

リリース日
2025-02-24
パラメータ
コンテキスト長
200K
モダリティ
image, pdf, text

能力レーダー

42
general
41
coding
62
reasoning
51
science推定
70
agents
80
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
エージェント能力111
35.0
LS
コーディングランキング170
52.0
AA
総合ランキング148
57.0
AA
数学的推論145
63.0
AA
科学148
55.0
AA

ベンチマークスコア (LLM Stats)

Agents

Terminal-Bench35.2%自己申告

Biology

GPQA84.8%自己申告

Code

SWE-Bench Verified70.3%自己申告

Communication

TAU-bench Retail81.2%自己申告
TAU-bench Airline58.4%自己申告

General

IFEval93.2%自己申告
MMMLU86.1%自己申告
MMMU75.0%自己申告

Math

MATH-50096.2%自己申告
AIME 202480.0%自己申告
AIME 202554.8%自己申告

AA評価指数

Math Index
56.3
Coding Index
36.4
Intelligence Index
27.1
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.8
Lcr
0.6
Aime 25
0.6
Tau2
0.5
Aime
0.5
Ifbench
0.5
Livecodebench
0.5
Scicode
0.4
Terminalbench Hard
0.2
Hle
0.1

LLM Statsカテゴリスコア

Instruction Following
90
Language
90
Structured Output
90
Math
80
Multimodal
80
Physics
80
General
80
Healthcare
80
Biology
80
Chemistry
80
Vision
80
Reasoning
70
Frontend Development
70
Communication
70
Tool Calling
70
Code
50
Agents
40

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料
キャッシュ読み取り価格$0.3 / 1Mトークン
キャッシュ書き込み価格$3.75 / 1Mトークン

速度

トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s

プロバイダー価格ランキング

プロバイダー価格ランキング

3 プロバイダー

最安: Abacus最高: Anthropic
プロバイダー入力出力
1Abacus最安
$3
$15
2LLM Gateway
$3
$15
3Anthropic
$3
$15

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク