Claude Sonnet 4.6 (Non-reasoning, High Effort)
AnthropicClaudeProprietary
説明
Claude Sonnet 4.6 is a full upgrade of the model's skills across coding, computer use, long-context reasoning, agent planning, knowledge work, and design. Users preferred Sonnet 4.6 over Sonnet 4.5 approximately 70% of the time. First Sonnet-class model with 1M token context window (beta) and context compaction. Major improvement in computer use skills compared to prior Sonnet models. Default model on Free and Pro plans. Pricing: $3/$15 per million tokens (input/output).
リリース日
2026-02-17
パラメータ
—
コンテキスト長
1.0M
モダリティ
audio, image, text, video
能力レーダー
38
general
46
coding
80
reasoning
55
science推定
80
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 31 | 63.0 | LS |
| Code Ranking | 30 | 78.0 | AA |
| General Ranking | 98 | 66.0 | AA |
| Reasoning | 64 | 58.0 | LS |
| Science | 81 | 64.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
GDPval-AA
1633.00 / 3000自己申告
BrowseComp
74.7%自己申告
OSWorld
72.5%自己申告
Finance Agent
63.3%自己申告
MCP Atlas
61.3%自己申告
Terminal-Bench 2.0
59.1%自己申告
Biology
GPQA
89.9%自己申告
Code
SWE-Bench Verified
79.6%自己申告
Communication
Tau2 Telecom
97.9%自己申告
Tau2 Retail
91.7%自己申告
General
MMMLU
89.3%自己申告
MMMU-Pro
75.6%自己申告
Math
Humanity's Last Exam
49.0%自己申告
Reasoning
ARC-AGI v2
58.3%自己申告
AA評価指数
Coding Index46.4
Intelligence Index44.4
Gpqa0.8
Tau20.8
Lcr0.6
Scicode0.5
Terminalbench Hard0.5
Ifbench0.4
Hle0.1
LLM Statsカテゴリスコア
Legal100
Finance100
General100
Agents100
Reasoning100
Biology90
Chemistry90
Communication90
Language90
Physics90
Tool Calling80
Frontend Development80
Code70
Math70
Multimodal70
Search70
Spatial Reasoning60
Vision60
Long Context50
Healthcare20
価格設定
入力価格$3.75 / 1M tokens
出力価格$15 / 1M tokens
混合価格(3:1)$6.563 / 1M tokens
速度
トークン/秒55.5 tokens/s
初トークン遅延1.07s
初回答遅延1.07s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| Anthropic | 3.0M | 15.0M |