メインコンテンツへスキップ

Claude 3.7 Sonnet (Non-reasoning)

AnthropicClaudeProprietary

説明

The most intelligent Claude model and the first hybrid reasoning model on the market. Claude 3.7 Sonnet can produce near-instant responses or extended, step-by-step thinking that is made visible to the user. Shows particularly strong improvements in coding and front-end web development.

リリース日
2025-02-24
パラメータ
コンテキスト長
200K
モダリティ
file, image, text

能力レーダー

42
general
32
coding
35
reasoning
44
science推定
70
agents
80
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools92
35.0
LS
Code Ranking173
46.0
AA
General Ranking169
56.0
AA
Math Reasoning252
34.0
AA
Science221
46.0
AA

ベンチマークスコア (LLM Stats)

Agents

Terminal-Bench35.2%自己申告

Biology

GPQA84.8%自己申告

Code

SWE-Bench Verified70.3%自己申告

Communication

TAU-bench Retail81.2%自己申告
TAU-bench Airline58.4%自己申告

General

IFEval93.2%自己申告
MMMLU86.1%自己申告
MMMU75.0%自己申告

Math

MATH-50096.2%自己申告
AIME 202480.0%自己申告
AIME 202554.8%自己申告

AA評価指数

Intelligence Index
30.8
Coding Index
26.7
Math Index
21.0
Math 500
0.8
Mmlu Pro
0.8
Gpqa
0.7
Tau2
0.5
Lcr
0.5
Ifbench
0.4
Livecodebench
0.4
Scicode
0.4
Aime
0.2
Terminalbench Hard
0.2
Aime 25
0.2
Hle
0.0

LLM Statsカテゴリスコア

Structured Output
90
Instruction Following
90
Language
90
Vision
80
Biology
80
Chemistry
80
General
80
Healthcare
80
Math
80
Multimodal
80
Physics
80
Tool Calling
70
Communication
70
Frontend Development
70
Reasoning
70
Code
50
Agents
40

価格設定

入力価格$3.75 / 1M tokens
出力価格$15 / 1M tokens
混合価格(3:1)$6.563 / 1M tokens

速度

トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク