跳轉到主要內容

DeepSeek V3.1 Terminus (Reasoning)

DeepSeekDeepSeek

描述

A powerful Mixture-of-Experts (MoE) language model with 671B total parameters (37B activated per token). Features Multi-head Latent Attention (MLA), auxiliary-loss-free load balancing, and multi-token prediction training. Pre-trained on 14.8T tokens with strong performance in reasoning, math, and code tasks.

發布日期
2025-09-22
參數規模
上下文長度
164K
支援模態
text

能力雷達圖

42
general
71
coding
88
reasoning
53
science估算
83
agents
0
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域#排名分數來源
程式碼能力榜62
74.0
AA
通用能力榜156
56.0
AA
數學推理36
91.0
AA
科學能力116
59.0
AA

基準測試分數 (LLM Stats)

Biology

GPQA59.1%自報

Code

Aider-Polyglot Edit79.7%自報
Aider-Polyglot49.6%自報
SWE-Bench Verified42.0%自報
LiveCodeBench37.6%自報

Factuality

SimpleQA24.9%自報

Finance

MMLU88.5%自報
MMLU-Pro75.9%自報

General

MMLU-Redux89.1%自報
C-Eval86.5%自報
IFEval86.1%自報
CSimpleQA64.8%自報
LongBench v248.7%自報

Language

CLUEWSC90.9%自報

Math

DROP91.6%自報
MATH-50090.2%自報
CNMO 202443.2%自報
AIME 202439.2%自報

Reasoning

HumanEval-Mul82.6%自報
FRAMES73.3%自報

AA 評測指數

Math Index
89.7
Intelligence Index
26.3
Aime 25
0.9
Mmlu Pro
0.9
Livecodebench
0.8
Gpqa
0.8
Lcr
0.7
Ifbench
0.6
Scicode
0.4
Tau2
0.4
Terminalbench Hard
0.3
Hle
0.2

LLM Stats 分類評分

Instruction Following
90
Language
80
Legal
80
Finance
80
Healthcare
80
Math
70
Reasoning
70
Structured Output
70
General
70
Physics
60
Biology
60
Chemistry
60
Long Context
50
Code
50
Frontend Development
40
Factuality
20

定價

輸入價格$1.635 / 1M tokens
輸出價格$2.75 / 1M tokens
混合價格(3:1)$1.914 / 1M tokens
快取讀取價格$0.13 / 1M tokens

速度

Tokens/秒0.0
首Token延遲0.00s
首回答延遲0.00s

供應商價格排行

供應商價格排行

5 個供應商

最便宜: Kilo Gateway最貴: DeepSeek
供應商輸入輸出
1Kilo Gateway最便宜
$0.21
$0.79
2OpenRouter
$0.27
$0.95
3NovitaAI
$0.27
$1
4Vercel AI Gateway
$0.27
$1
5DeepSeek主要
$1.635
$2.75

比較該模型在不同 API 供應商之間的定價。

外部連結