Claude 4 Opus (Reasoning)
AnthropicClaude
發布日期
2025-05-22
參數規模
—
上下文長度
1.0M
支援模態
image, pdf, text
能力雷達圖
45
general
58
coding
78
reasoning
52
science估算
80
agents
80
multimodal
Science 在缺少專門科學評測時使用推理能力代理估算。
排行榜排名
基準測試分數 (LLM Stats)
Agents
Vending-Bench 2
801759.0%自報
GDPval-AA
1606.00 / 3000自報
DeepSearchQA
91.3%自報
BrowseComp
84.0%自報
CyberGym
73.8%自報
OSWorld
72.7%自報
Terminal-Bench 2.0
65.4%自報
MCP Atlas
62.7%自報
Finance Agent
60.7%自報
FrontierSWE
56.0%自報
OpenRCA
34.9%自報
Legal Agent Benchmark
4.2%自報
Biology
GPQA
91.3%自報
Code
SWE-Bench Verified
80.8%自報
SWE-bench Multilingual
77.8%自報
Communication
Tau2 Telecom
99.3%自報
Tau2 Retail
91.9%自報
General
MMMLU
91.1%自報
MMMU-Pro
77.3%自報
LiveBench
76.3%自報
MRCR v2 (8-needle)
76.0%自報
Healthcare
FigQA
78.3%自報
Long Context
Graphwalks parents >128k
95.4%自報
Graphwalks BFS >128k
61.5%自報
Math
AIME 2025
99.8%自報
Humanity's Last Exam
53.1%自報
Multimodal
CharXiv-R
77.4%自報
Reasoning
ARC-AGI v2
68.8%自報
AA 評測指數
Math Index73.3
Intelligence Index31.0
Math 5001.0
Mmlu Pro0.9
Gpqa0.8
Aime0.8
Tau20.7
Aime 250.7
Livecodebench0.6
Ifbench0.5
Scicode0.4
Lcr0.3
Terminalbench Hard0.3
Hle0.1
LLM Stats 分類評分
Agents100
Finance100
Legal100
Reasoning100
General100
Communication100
Language90
Physics90
Search90
Biology90
Chemistry90
Long Context80
Math80
Multimodal80
Safety80
Spatial Reasoning80
Frontend Development80
Healthcare80
Tool Calling80
Code70
Vision70
定價
輸入價格$15 / 1M tokens
輸出價格$75 / 1M tokens
混合價格(3:1)$30 / 1M tokens
快取讀取價格$0.5 / 1M tokens
快取寫入價格$6.25 / 1M tokens
速度
Tokens/秒0.0
首Token延遲0.00s
首回答延遲0.00s
供應商價格排行
供應商價格排行
1 個供應商
供應商輸入輸出
1Anthropic主要
$15
$75
比較該模型在不同 API 供應商之間的定價。