Claude 2.1
AnthropicClaude
リリース日
2023-11-21
パラメータ
—
コンテキスト長
1.0M
モダリティ
image, pdf, text
能力レーダー
18
general
16
coding
19
reasoning
22
science推定
80
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 374 | 19.0 | AA |
| 総合ランキング | 447 | 21.0 | AA |
| 数学的推論 | 309 | 19.0 | AA |
| 科学 | 438 | 21.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
Vending-Bench 2
801759.0%自己申告
GDPval-AA
1606.00 / 3000自己申告
DeepSearchQA
91.3%自己申告
BrowseComp
84.0%自己申告
CyberGym
73.8%自己申告
OSWorld
72.7%自己申告
Terminal-Bench 2.0
65.4%自己申告
MCP Atlas
62.7%自己申告
Finance Agent
60.7%自己申告
FrontierSWE
56.0%自己申告
OpenRCA
34.9%自己申告
Legal Agent Benchmark
4.2%自己申告
Biology
GPQA
91.3%自己申告
Code
SWE-Bench Verified
80.8%自己申告
SWE-bench Multilingual
77.8%自己申告
Communication
Tau2 Telecom
99.3%自己申告
Tau2 Retail
91.9%自己申告
General
MMMLU
91.1%自己申告
MMMU-Pro
77.3%自己申告
LiveBench
76.3%自己申告
MRCR v2 (8-needle)
76.0%自己申告
Healthcare
FigQA
78.3%自己申告
Long Context
Graphwalks parents >128k
95.4%自己申告
Graphwalks BFS >128k
61.5%自己申告
Math
AIME 2025
99.8%自己申告
Humanity's Last Exam
53.1%自己申告
Multimodal
CharXiv-R
77.4%自己申告
Reasoning
ARC-AGI v2
68.8%自己申告
AA評価指数
Coding Index14.0
Intelligence Index3.9
Mmlu Pro0.5
Math 5000.4
Gpqa0.3
Livecodebench0.2
Scicode0.2
Hle0.0
Aime0.0
LLM Statsカテゴリスコア
Agents100
Finance100
Legal100
Reasoning100
General100
Communication100
Language90
Physics90
Search90
Biology90
Chemistry90
Long Context80
Math80
Multimodal80
Safety80
Spatial Reasoning80
Frontend Development80
Healthcare80
Tool Calling80
Code70
Vision70
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
キャッシュ読み取り価格$0.5 / 1Mトークン
キャッシュ書き込み価格$6.25 / 1Mトークン
速度
トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s
プロバイダー価格ランキング
プロバイダーデータがありません