DeepSeek R1 0528 (May '25)
DeepSeekDeepSeekOpen WeightMIT · Commercial OK
설명
DeepSeek-R1-0528 is the May 28, 2025 version of DeepSeek's reasoning model. It features advanced thinking capabilities and serves as a benchmark comparison for newer models like DeepSeek-V3.1. This model excels in complex reasoning tasks, mathematical problem-solving, and code generation through its thinking mode approach.
출시일
2025-05-28
파라미터
671.0B
컨텍스트 길이
164K
모달리티
text
능력 레이더
43
general
44
coding
83
reasoning
54
science추정
10
agents
0
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Agents & Tools | 102 | 8.0 | LS |
| Code Ranking | 129 | 53.0 | AA |
| General Ranking | 198 | 50.0 | AA |
| Math Reasoning | 65 | 85.0 | AA |
| Reasoning | 95 | 36.0 | LS |
| Science | 101 | 61.0 | AA |
벤치마크 점수 (LLM Stats)
Agents
BrowseComp
8.9%자체 보고
Terminal-Bench
5.7%자체 보고
Biology
GPQA
81.0%자체 보고
Code
LiveCodeBench
73.3%자체 보고
Aider-Polyglot
71.6%자체 보고
SWE-Bench Verified
44.6%자체 보고
SWE-bench Multilingual
30.5%자체 보고
Factuality
SimpleQA
92.3%자체 보고
Finance
MMLU-Pro
85.0%자체 보고
General
MMLU-Redux
93.4%자체 보고
Math
AIME 2024
91.4%자체 보고
AIME 2025
87.5%자체 보고
HMMT 2025
79.4%자체 보고
CodeForces
0.64 / 3000자체 보고
Humanity's Last Exam
17.7%자체 보고
Reasoning
BrowseComp-zh
35.7%자체 보고
AA 평가 지수
Math Index76.0
Intelligence Index27.1
Coding Index24.0
Math 5001.0
Aime0.9
Mmlu Pro0.8
Gpqa0.8
Livecodebench0.8
Aime 250.8
Lcr0.5
Scicode0.4
Ifbench0.4
Tau20.4
Terminalbench Hard0.2
Hle0.1
LLM Stats 카테고리 점수
Factuality90
Language90
Biology80
Chemistry80
Finance80
General80
Healthcare80
Legal80
Physics80
Math70
Reasoning60
Code50
Frontend Development40
Vision20
Search20
Agents10
가격
입력 가격$1.35 / 1M tokens
출력 가격$4.2 / 1M tokens
혼합 가격 (3:1)$2.063 / 1M tokens
속도
토큰/초0.0 tokens/s
첫 토큰 지연0.00s
첫 응답 지연0.00s
사용 가능한 프로바이더
(LS 내부 단위)| 프로바이더 | 입력 가격 | 출력 가격 |
|---|---|---|
| DeepSeek | 550K | 2.2M |
| Novita | 700K | 2.5M |