メインコンテンツへスキップ

DeepSeek V3.1 (Non-reasoning)

DeepSeekDeepSeekOpen WeightMIT · Commercial OK

説明

DeepSeek-V3.1 is a hybrid model supporting both thinking and non-thinking modes through different chat templates. Built on DeepSeek-V3.1-Base with a two-phase long context extension (32K phase: 630B tokens, 128K phase: 209B tokens), it features 671B total parameters with 37B activated. Key improvements include smarter tool calling through post-training optimization, higher thinking efficiency achieving comparable quality to DeepSeek-R1-0528 while responding more quickly, and UE8M0 FP8 scale data format for model weights and activations. The model excels in both reasoning tasks (thinking mode) and practical applications (non-thinking mode), with particularly strong performance in code agent tasks, math competitions, and search-based problem solving.

リリース日
2025-08-21
パラメータ
671.0B
コンテキスト長
33K
モダリティ
text

能力レーダー

41
general
39
coding
54
reasoning
47
science推定
30
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools95
31.0
LS
Code Ranking138
52.0
AA
General Ranking208
49.0
AA
Math Reasoning183
50.0
AA
Reasoning88
49.0
LS
Science179
50.0
AA

ベンチマークスコア (LLM Stats)

Agents

Terminal-Bench31.3%自己申告
BrowseComp30.0%自己申告

Biology

GPQA74.9%自己申告

Code

Aider-Polyglot68.4%自己申告
SWE-Bench Verified66.0%自己申告
LiveCodeBench56.4%自己申告
SWE-bench Multilingual54.5%自己申告

Factuality

SimpleQA93.4%自己申告

Finance

MMLU-Pro83.7%自己申告

General

MMLU-Redux91.8%自己申告

Math

CodeForces0.70 / 3000自己申告
AIME 202466.3%自己申告
AIME 202549.8%自己申告
HMMT 202533.5%自己申告
Humanity's Last Exam15.9%自己申告

Reasoning

BrowseComp-zh49.2%自己申告

AA評価指数

Math Index
49.7
Coding Index
28.4
Intelligence Index
28.1
Mmlu Pro
0.8
Gpqa
0.7
Livecodebench
0.6
Aime 25
0.5
Lcr
0.5
Ifbench
0.4
Scicode
0.4
Tau2
0.3
Terminalbench Hard
0.2
Hle
0.1

LLM Statsカテゴリスコア

Factuality
90
Language
90
Finance
80
General
80
Healthcare
80
Legal
80
Biology
70
Chemistry
70
Frontend Development
70
Physics
70
Code
60
Math
60
Reasoning
60
Search
40
Agents
30
Vision
20

価格設定

入力価格$0.555 / 1M tokens
出力価格$1.67 / 1M tokens
混合価格(3:1)$0.834 / 1M tokens

速度

トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s

利用可能なプロバイダー

(LS内部単位)
プロバイダー入力価格出力価格
Novita270K1.0M
DeepInfra270K1.0M

外部リンク