DeepSeek V3.2 (Non-reasoning)
DeepSeekDeepSeekOpen WeightMIT · Commercial OK
説明
DeepSeek-V3.2 is a 685B-parameter MoE model that harmonizes high computational efficiency with superior reasoning and agent performance. It introduces DeepSeek Sparse Attention (DSA) for efficient long-context processing, a scalable reinforcement learning post-training framework, and large-scale agentic task synthesis covering 1,800+ environments. V3.2 achieves GPT-5-level performance across reasoning, coding, and agentic benchmarks, with gold-medal results from its Speciale variant on IMO, IOI, ICPC World Finals, and CMO 2025.
リリース日
2025-12-01
パラメータ
685.0B
コンテキスト長
131K
モダリティ
text
能力レーダー
44
general
44
coding
62
reasoning
49
science推定
50
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 75 | 50.0 | LS |
| Code Ranking | 110 | 58.0 | AA |
| General Ranking | 112 | 65.0 | AA |
| Math Reasoning | 149 | 60.0 | AA |
| Reasoning | 57 | 65.0 | LS |
| Science | 140 | 55.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
t2-bench
80.3%自己申告
BrowseComp
51.4%自己申告
Terminal-Bench 2.0
46.4%自己申告
MCP-Universe
45.9%自己申告
MCP-Mark
38.0%自己申告
Toolathlon
35.2%自己申告
Biology
GPQA
82.4%自己申告
Code
LiveCodeBench
83.3%自己申告
SWE-Bench Verified
73.1%自己申告
SWE-bench Multilingual
70.2%自己申告
Finance
MMLU-Pro
85.0%自己申告
Math
AIME 2025
93.1%自己申告
HMMT 2025
90.2%自己申告
CodeForces
0.80 / 3000自己申告
IMO-AnswerBench
78.3%自己申告
Humanity's Last Exam
40.8%自己申告
Reasoning
BrowseComp-zh
65.0%自己申告
AA評価指数
Math Index59.0
Coding Index34.6
Intelligence Index32.1
Mmlu Pro0.8
Tau20.8
Gpqa0.8
Livecodebench0.6
Aime 250.6
Ifbench0.5
Lcr0.4
Scicode0.4
Terminalbench Hard0.3
Hle0.1
LLM Statsカテゴリスコア
Biology80
Chemistry80
Finance80
General80
Healthcare80
Language80
Legal80
Math80
Physics80
Code70
Frontend Development70
Reasoning70
Search60
Tool Calling50
Agents50
Vision40
価格設定
入力価格$0.5 / 1M tokens
出力価格$1.6 / 1M tokens
混合価格(3:1)$0.775 / 1M tokens
速度
トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| DeepInfra | 260K | 380K |
| Novita | 270K | 400K |
| Fireworks | 560K | 1.7M |