Claude Opus 4.6 (Non-reasoning, High Effort)
AnthropicClaudeProprietary
説明
Claude Opus 4.6 is Anthropic's most intelligent model, improving on its predecessor's coding skills with more careful planning, longer agentic task sustenance, more reliable operation in larger codebases, and better code review and debugging skills. First Opus-class model with 1M token context window (beta), 128K output tokens, and adaptive thinking. Features effort controls (low/medium/high/max) and context compaction for long-running tasks. State-of-the-art on Terminal-Bench 2.0, Humanity's Last Exam, GDPval-AA, and BrowseComp. Pricing: $5/$25 per million tokens (input/output).
リリース日
2026-02-05
パラメータ
—
コンテキスト長
1.0M
モダリティ
image, text
能力レーダー
41
general
47
coding
84
reasoning
58
science推定
80
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 17 | 68.0 | LS |
| Code Ranking | 26 | 80.0 | AA |
| General Ranking | 86 | 71.0 | AA |
| Multimodal Ranking | 37 | 77.0 | LS |
| Reasoning | 46 | 69.0 | LS |
| Science | 58 | 69.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
Vending-Bench 2
801759.0%自己申告
GDPval-AA
1606.00 / 3000自己申告
DeepSearchQA
91.3%自己申告
BrowseComp
84.0%自己申告
CyberGym
73.8%自己申告
OSWorld
72.7%自己申告
Terminal-Bench 2.0
65.4%自己申告
MCP Atlas
62.7%自己申告
Finance Agent
60.7%自己申告
OpenRCA
34.9%自己申告
Biology
GPQA
91.3%自己申告
Code
SWE-Bench Verified
80.8%自己申告
SWE-bench Multilingual
77.8%自己申告
Communication
Tau2 Telecom
99.3%自己申告
Tau2 Retail
91.9%自己申告
General
MRCR v2 (8-needle)
93.0%自己申告
MMMLU
91.1%自己申告
MMMU-Pro
77.3%自己申告
Healthcare
FigQA
78.3%自己申告
Long Context
Graphwalks parents >128k
95.4%自己申告
Graphwalks BFS >128k
61.5%自己申告
Math
AIME 2025
99.8%自己申告
Humanity's Last Exam
53.1%自己申告
Multimodal
CharXiv-R
77.4%自己申告
Reasoning
ARC-AGI v2
68.8%自己申告
AA評価指数
Coding Index47.6
Intelligence Index46.5
Tau20.8
Gpqa0.8
Lcr0.6
Terminalbench Hard0.5
Scicode0.5
Ifbench0.4
Hle0.2
LLM Statsカテゴリスコア
Legal100
Agents100
Finance100
Reasoning100
General100
Communication100
Biology90
Chemistry90
Language90
Physics90
Search90
Spatial Reasoning80
Tool Calling80
Frontend Development80
Healthcare80
Long Context80
Math80
Multimodal80
Safety80
Vision70
Code70
価格設定
入力価格$6.25 / 1M tokens
出力価格$25 / 1M tokens
混合価格(3:1)$10.938 / 1M tokens
速度
トークン/秒49.0 tokens/s
初トークン遅延1.44s
初回答遅延1.44s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| Anthropic | 5.0M | 25.0M |