DeepSeek V3.2 (Non-reasoning)
DeepSeekDeepSeekOpen WeightMIT · Commercial OK
설명
DeepSeek-V3.2 is a 685B-parameter MoE model that harmonizes high computational efficiency with superior reasoning and agent performance. It introduces DeepSeek Sparse Attention (DSA) for efficient long-context processing, a scalable reinforcement learning post-training framework, and large-scale agentic task synthesis covering 1,800+ environments. V3.2 achieves GPT-5-level performance across reasoning, coding, and agentic benchmarks, with gold-medal results from its Speciale variant on IMO, IOI, ICPC World Finals, and CMO 2025.
출시일
2025-12-01
파라미터
685.0B
컨텍스트 길이
131K
모달리티
text
능력 레이더
44
general
44
coding
62
reasoning
49
science추정
50
agents
0
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Agents & Tools | 75 | 50.0 | LS |
| Code Ranking | 110 | 58.0 | AA |
| General Ranking | 112 | 65.0 | AA |
| Math Reasoning | 149 | 60.0 | AA |
| Reasoning | 57 | 65.0 | LS |
| Science | 140 | 55.0 | AA |
벤치마크 점수 (LLM Stats)
Agents
t2-bench
80.3%자체 보고
BrowseComp
51.4%자체 보고
Terminal-Bench 2.0
46.4%자체 보고
MCP-Universe
45.9%자체 보고
MCP-Mark
38.0%자체 보고
Toolathlon
35.2%자체 보고
Biology
GPQA
82.4%자체 보고
Code
LiveCodeBench
83.3%자체 보고
SWE-Bench Verified
73.1%자체 보고
SWE-bench Multilingual
70.2%자체 보고
Finance
MMLU-Pro
85.0%자체 보고
Math
AIME 2025
93.1%자체 보고
HMMT 2025
90.2%자체 보고
CodeForces
0.80 / 3000자체 보고
IMO-AnswerBench
78.3%자체 보고
Humanity's Last Exam
40.8%자체 보고
Reasoning
BrowseComp-zh
65.0%자체 보고
AA 평가 지수
Math Index59.0
Coding Index34.6
Intelligence Index32.1
Mmlu Pro0.8
Tau20.8
Gpqa0.8
Livecodebench0.6
Aime 250.6
Ifbench0.5
Lcr0.4
Scicode0.4
Terminalbench Hard0.3
Hle0.1
LLM Stats 카테고리 점수
Biology80
Chemistry80
Finance80
General80
Healthcare80
Language80
Legal80
Math80
Physics80
Code70
Frontend Development70
Reasoning70
Search60
Tool Calling50
Agents50
Vision40
가격
입력 가격$0.5 / 1M tokens
출력 가격$1.6 / 1M tokens
혼합 가격 (3:1)$0.775 / 1M tokens
속도
토큰/초0.0 tokens/s
첫 토큰 지연0.00s
첫 응답 지연0.00s
사용 가능한 프로바이더
(LS 내부 단위)| 프로바이더 | 입력 가격 | 출력 가격 |
|---|---|---|
| DeepInfra | 260K | 380K |
| Novita | 270K | 400K |
| Fireworks | 560K | 1.7M |