Claude 3 Opus
AnthropicClaudeProprietary
説明
Claude 3 Opus is Anthropic's most intelligent model, with best-in-market performance on highly complex tasks. It can navigate open-ended prompts and sight-unseen scenarios with remarkable fluency and human-like understanding, showing the outer limits of what's possible with generative AI.
リリース日
2024-03-04
パラメータ
—
コンテキスト長
—
モダリティ
image, text
能力レーダー
31
general
23
coding
31
reasoning
31
science推定
0
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 252 | 32.0 | AA |
| General Ranking | 260 | 41.0 | AA |
| Math Reasoning | 254 | 33.0 | AA |
| Reasoning | 2 | 95.0 | LS |
| Science | 358 | 30.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
50.4%自己申告
Code
HumanEval
84.9%自己申告
Finance
MMLU
86.8%自己申告
MMLU-Pro
68.5%自己申告
General
ARC-C
96.4%自己申告
Language
BIG-Bench Hard
86.8%自己申告
Math
GSM8k
95.0%自己申告
MGSM
90.7%自己申告
DROP
83.1%自己申告
MATH
60.1%自己申告
Reasoning
HellaSwag
95.4%自己申告
AA評価指数
Coding Index19.5
Intelligence Index18.0
Mmlu Pro0.7
Math 5000.6
Gpqa0.5
Livecodebench0.3
Scicode0.2
Aime0.0
Hle0.0
LLM Statsカテゴリスコア
Code80
Finance80
General80
Healthcare80
Language80
Legal80
Math80
Reasoning80
Biology50
Chemistry50
Physics50
価格設定
入力価格$18.75 / 1M tokens
出力価格$75 / 1M tokens
混合価格(3:1)$32.813 / 1M tokens
速度
トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません