DeepSeek R1 0528 (May '25)
DeepSeekDeepSeekOpen WeightMIT · Commercial OK
説明
DeepSeek-R1-0528 is the May 28, 2025 version of DeepSeek's reasoning model. It features advanced thinking capabilities and serves as a benchmark comparison for newer models like DeepSeek-V3.1. This model excels in complex reasoning tasks, mathematical problem-solving, and code generation through its thinking mode approach.
リリース日
2025-05-28
パラメータ
671.0B
コンテキスト長
164K
モダリティ
text
能力レーダー
43
general
44
coding
83
reasoning
54
science推定
10
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 102 | 8.0 | LS |
| Code Ranking | 129 | 53.0 | AA |
| General Ranking | 198 | 50.0 | AA |
| Math Reasoning | 65 | 85.0 | AA |
| Reasoning | 95 | 36.0 | LS |
| Science | 101 | 61.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
BrowseComp
8.9%自己申告
Terminal-Bench
5.7%自己申告
Biology
GPQA
81.0%自己申告
Code
LiveCodeBench
73.3%自己申告
Aider-Polyglot
71.6%自己申告
SWE-Bench Verified
44.6%自己申告
SWE-bench Multilingual
30.5%自己申告
Factuality
SimpleQA
92.3%自己申告
Finance
MMLU-Pro
85.0%自己申告
General
MMLU-Redux
93.4%自己申告
Math
AIME 2024
91.4%自己申告
AIME 2025
87.5%自己申告
HMMT 2025
79.4%自己申告
CodeForces
0.64 / 3000自己申告
Humanity's Last Exam
17.7%自己申告
Reasoning
BrowseComp-zh
35.7%自己申告
AA評価指数
Math Index76.0
Intelligence Index27.1
Coding Index24.0
Math 5001.0
Aime0.9
Mmlu Pro0.8
Gpqa0.8
Livecodebench0.8
Aime 250.8
Lcr0.5
Scicode0.4
Ifbench0.4
Tau20.4
Terminalbench Hard0.2
Hle0.1
LLM Statsカテゴリスコア
Factuality90
Language90
Biology80
Chemistry80
Finance80
General80
Healthcare80
Legal80
Physics80
Math70
Reasoning60
Code50
Frontend Development40
Vision20
Search20
Agents10
価格設定
入力価格$1.35 / 1M tokens
出力価格$4.2 / 1M tokens
混合価格(3:1)$2.063 / 1M tokens
速度
トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| DeepSeek | 550K | 2.2M |
| Novita | 700K | 2.5M |