メインコンテンツへスキップ

DeepSeek R1 0528 (May '25)

DeepSeekDeepSeekOpen WeightMIT · Commercial OK

説明

DeepSeek-R1-0528 is the May 28, 2025 version of DeepSeek's reasoning model. It features advanced thinking capabilities and serves as a benchmark comparison for newer models like DeepSeek-V3.1. This model excels in complex reasoning tasks, mathematical problem-solving, and code generation through its thinking mode approach.

リリース日
2025-05-28
パラメータ
671.0B
コンテキスト長
164K
モダリティ
text

能力レーダー

43
general
44
coding
83
reasoning
54
science推定
10
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools102
8.0
LS
Code Ranking129
53.0
AA
General Ranking198
50.0
AA
Math Reasoning65
85.0
AA
Reasoning95
36.0
LS
Science101
61.0
AA

ベンチマークスコア (LLM Stats)

Agents

BrowseComp8.9%自己申告
Terminal-Bench5.7%自己申告

Biology

GPQA81.0%自己申告

Code

LiveCodeBench73.3%自己申告
Aider-Polyglot71.6%自己申告
SWE-Bench Verified44.6%自己申告
SWE-bench Multilingual30.5%自己申告

Factuality

SimpleQA92.3%自己申告

Finance

MMLU-Pro85.0%自己申告

General

MMLU-Redux93.4%自己申告

Math

AIME 202491.4%自己申告
AIME 202587.5%自己申告
HMMT 202579.4%自己申告
CodeForces0.64 / 3000自己申告
Humanity's Last Exam17.7%自己申告

Reasoning

BrowseComp-zh35.7%自己申告

AA評価指数

Math Index
76.0
Intelligence Index
27.1
Coding Index
24.0
Math 500
1.0
Aime
0.9
Mmlu Pro
0.8
Gpqa
0.8
Livecodebench
0.8
Aime 25
0.8
Lcr
0.5
Scicode
0.4
Ifbench
0.4
Tau2
0.4
Terminalbench Hard
0.2
Hle
0.1

LLM Statsカテゴリスコア

Factuality
90
Language
90
Biology
80
Chemistry
80
Finance
80
General
80
Healthcare
80
Legal
80
Physics
80
Math
70
Reasoning
60
Code
50
Frontend Development
40
Vision
20
Search
20
Agents
10

価格設定

入力価格$1.35 / 1M tokens
出力価格$4.2 / 1M tokens
混合価格(3:1)$2.063 / 1M tokens

速度

トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s

利用可能なプロバイダー

(LS内部単位)
プロバイダー入力価格出力価格
DeepSeek550K2.2M
Novita700K2.5M

外部リンク