DeepSeek R1 0528 Qwen3 8B
DeepSeekDeepSeek
リリース日
2025-05-29
パラメータ
—
コンテキスト長
1.0M
モダリティ
text
能力レーダー
29
general
44
coding
68
reasoning
36
science推定
60
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| エージェント能力 | 40 | 59.0 | LS |
| コーディングランキング | 329 | 25.0 | AA |
| 総合ランキング | 412 | 25.0 | AA |
| 数学的推論 | 117 | 71.0 | AA |
| 科学 | 337 | 34.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
GDPval-AA
1332.00 / 3000自己申告
BrowseComp
83.4%自己申告
MCP Atlas
73.6%自己申告
Terminal-Bench 2.0
67.9%自己申告
SWE-Bench Pro
55.4%自己申告
Toolathlon
51.8%自己申告
FrontierSWE
29.0%自己申告
Biology
GPQA
90.1%自己申告
Code
LiveCodeBench
93.5%自己申告
SWE-Bench Verified
80.6%自己申告
SWE-bench Multilingual
76.2%自己申告
Factuality
SimpleQA
57.9%自己申告
Finance
MMLU-Pro
87.5%自己申告
General
CSimpleQA
84.4%自己申告
MRCR 1M
83.5%自己申告
LiveBench
73.6%自己申告
CorpusQA 1M
62.0%自己申告
Math
CodeForces
1.00 / 3000自己申告
HMMT Feb 26
95.2%自己申告
MathArena Apex
90.2%自己申告
IMO-AnswerBench
89.8%自己申告
Humanity's Last Exam
48.2%自己申告
AA評価指数
Math Index63.7
Intelligence Index10.4
Math 5000.9
Mmlu Pro0.7
Aime0.7
Aime 250.6
Gpqa0.6
Livecodebench0.5
Scicode0.2
Ifbench0.2
Lcr0.1
Hle0.1
Terminalbench Hard0.0
Tau20.0
LLM Statsカテゴリスコア
Legal100
Finance100
Agents100
General100
Reasoning71
Language90
Physics90
Healthcare90
Biology90
Chemistry90
Long Context80
Math80
Search80
Frontend Development80
Code70
Factuality60
Tool Calling60
Vision50
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
キャッシュ読み取り価格$0.00363 / 1Mトークン
速度
トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s
プロバイダー価格ランキング
プロバイダー価格ランキング
15 プロバイダー
最安: NovitaAI最高: Azure
プロバイダー入力出力
1NovitaAI最安
$0.06
$0.09
2CrofAI
$0.35
$0.8
3DeepSeek
$0.435
$0.87
4Alibaba (China)
$0.435
$0.87
5Vivgrid
$0.435
$0.87
6LLM Gateway
$0.435
$0.87
7Auriko
$0.435
$0.87
8Cortecs
$1.553
$3.106
9Venice AI
$1.73
$3.796
10OpenCode Go
$1.74
$3.48
11OpenCode Zen
$1.74
$3.84
12FrogBot
$1.74
$3.48
13Wafer
$1.74
$3.48
14DigitalOcean
$1.74
$3.48
15Azure
$1.74
$3.48
このモデルの異なるAPIプロバイダー間の価格を比較。