メインコンテンツへスキップ

DeepSeek V3.1 (Reasoning)

DeepSeekDeepSeek

説明

DeepSeek-V3.1 is a hybrid model supporting both thinking and non-thinking modes through different chat templates. Built on DeepSeek-V3.1-Base with a two-phase long context extension (32K phase: 630B tokens, 128K phase: 209B tokens), it features 671B total parameters with 37B activated. Key improvements include smarter tool calling through post-training optimization, higher thinking efficiency achieving comparable quality to DeepSeek-R1-0528 while responding more quickly, and UE8M0 FP8 scale data format for model weights and activations. The model excels in both reasoning tasks (thinking mode) and practical applications (non-thinking mode), with particularly strong performance in code agent tasks, math competitions, and search-based problem solving.

リリース日
2025-08-21
パラメータ
コンテキスト長
164K
モダリティ
text

能力レーダー

39
general
70
coding
88
reasoning
51
science推定
30
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
エージェント能力116
31.0
LS
コーディングランキング103
65.0
AA
総合ランキング210
48.0
AA
数学的推論35
91.0
AA
推論93
49.0
LS
科学137
56.0
AA

ベンチマークスコア (LLM Stats)

Agents

Terminal-Bench31.3%自己申告
BrowseComp30.0%自己申告

Biology

GPQA74.9%自己申告

Code

Aider-Polyglot68.4%自己申告
SWE-Bench Verified66.0%自己申告
LiveCodeBench56.4%自己申告
SWE-bench Multilingual54.5%自己申告

Factuality

SimpleQA93.4%自己申告

Finance

MMLU-Pro83.7%自己申告

General

MMLU-Redux91.8%自己申告

Math

CodeForces0.70 / 3000自己申告
AIME 202466.3%自己申告
AIME 202549.8%自己申告
HMMT 202533.5%自己申告
Humanity's Last Exam15.9%自己申告

Reasoning

BrowseComp-zh49.2%自己申告

AA評価指数

Math Index
89.7
Intelligence Index
20.7
Aime 25
0.9
Mmlu Pro
0.9
Livecodebench
0.8
Gpqa
0.8
Lcr
0.5
Ifbench
0.4
Scicode
0.4
Tau2
0.4
Terminalbench Hard
0.3
Hle
0.1

LLM Statsカテゴリスコア

Language
90
Factuality
90
Legal
80
Finance
80
General
80
Healthcare
80
Physics
70
Frontend Development
70
Biology
70
Chemistry
70
Math
60
Reasoning
60
Code
60
Search
40
Agents
30
Vision
20

価格設定

入力価格$0.59 / 1Mトークン
出力価格$1.69 / 1Mトークン
混合価格(3:1)$0.865 / 1Mトークン
キャッシュ読み取り価格$0.13 / 1Mトークン

速度

トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s

プロバイダー価格ランキング

プロバイダー価格ランキング

3 プロバイダー

最安: Kilo Gateway最高: DeepSeek
プロバイダー入力出力
1Kilo Gateway最安
$0.15
$0.75
2OpenRouter
$0.21
$0.79
3DeepSeekプライマリ
$0.59
$1.69

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク