Claude Opus 4.5 (Non-reasoning)
AnthropicClaudeProprietary
説明
Premium model combining maximum intelligence with practical performance. Best model in the world for coding, agents, and computer use. Most robustly aligned model with best prompt injection resistance of any frontier model. Features extended thinking, 200K context window, 64K max output, and a new effort parameter for controlling reasoning depth. Pricing: $5/$25 per million tokens (input/output).
リリース日
2025-11-24
パラメータ
—
コンテキスト長
200K
モダリティ
file, image, text
能力レーダー
52
general
54
coding
66
reasoning
55
science推定
80
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 33 | 62.0 | LS |
| Code Ranking | 36 | 76.0 | AA |
| General Ranking | 72 | 74.0 | AA |
| Math Reasoning | 145 | 63.0 | AA |
| Reasoning | 93 | 38.0 | LS |
| Science | 87 | 64.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
OSWorld
66.3%自己申告
MCP Atlas
62.3%自己申告
Terminal-Bench 2.0
59.3%自己申告
Biology
GPQA
87.0%自己申告
Code
SWE-Bench Verified
80.9%自己申告
Communication
Tau2 Telecom
98.2%自己申告
Tau2 Retail
88.9%自己申告
General
MMMLU
90.8%自己申告
MMMU (validation)
80.7%自己申告
Reasoning
ARC-AGI v2
37.6%自己申告
AA評価指数
Math Index62.7
Intelligence Index43.1
Coding Index42.9
Mmlu Pro0.9
Tau20.9
Gpqa0.8
Livecodebench0.7
Lcr0.7
Aime 250.6
Scicode0.5
Ifbench0.4
Terminalbench Hard0.4
Hle0.1
LLM Statsカテゴリスコア
Biology90
Chemistry90
Communication90
Language90
Math90
Physics90
Tool Calling80
Frontend Development80
General80
Healthcare80
Reasoning80
Code70
Multimodal70
Vision60
Agents60
Spatial Reasoning40
価格設定
入力価格$6.25 / 1M tokens
出力価格$25 / 1M tokens
混合価格(3:1)$10.938 / 1M tokens
速度
トークン/秒57.7 tokens/s
初トークン遅延1.11s
初回答遅延1.11s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| Anthropic | 5.0M | 25.0M |