跳转到主要内容

DeepSeek V3.1 (Reasoning)

DeepSeekDeepSeek
发布日期
2025-08-21
参数规模
上下文长度
33K
支持模态
text

能力雷达图

43
general
48
coding
88
reasoning
51
science估算
0
agents
0
multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域#排名分数来源
代码能力榜107
59.0
AA
通用能力榜193
51.0
AA
数学推理36
91.0
AA
科学能力121
58.0
AA

基准测试分数 (LLM Stats)

暂无基准测试数据

AA 评测指数

Math Index
89.7
Coding Index
29.7
Intelligence Index
27.7
Aime 25
0.9
Mmlu Pro
0.9
Livecodebench
0.8
Gpqa
0.8
Lcr
0.5
Ifbench
0.4
Scicode
0.4
Tau2
0.4
Terminalbench Hard
0.3
Hle
0.1

LLM Stats 分类评分

暂无分类评分数据

定价

输入价格$0.59 / 1M tokens
输出价格$1.69 / 1M tokens
混合价格(3:1)$0.865 / 1M tokens

速度

Tokens/秒0.0 tokens/s
首Token延迟0.00s
首回答延迟0.00s

可用提供商

(LS 内部计价单位)

暂无提供商数据

外部链接

暂无外部链接