跳转到主要内容

DeepSeek R1 Distill Llama 70B

DeepSeekLlamaOpen WeightMIT · Commercial OK

描述

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

发布日期
2025-01-20
参数规模
70.6B
上下文长度
131K
支持模态
text

能力雷达图

34
general
19
coding
62
reasoning
30
science估算
0
agents
0
multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域#排名分数来源
代码能力榜365
17.0
AA
通用能力榜323
34.0
AA
数学推理136
65.0
AA
科学能力326
33.0
AA

基准测试分数 (LLM Stats)

Biology

GPQA65.2%自报

Code

LiveCodeBench57.5%自报

Math

MATH-50094.5%自报
AIME 202486.7%自报

AA 评测指数

Math Index
53.7
Intelligence Index
16.0
Coding Index
11.4
Math 500
0.9
Mmlu Pro
0.8
Aime
0.7
Aime 25
0.5
Gpqa
0.4
Scicode
0.3
Ifbench
0.3
Livecodebench
0.3
Tau2
0.2
Lcr
0.1
Hle
0.1
Terminalbench Hard
0.0

LLM Stats 分类评分

Math
90
Reasoning
80
Biology
70
Chemistry
70
Physics
70
Code
60
General
60

定价

输入价格$0.7 / 1M tokens
输出价格$1.05 / 1M tokens
混合价格(3:1)$0.787 / 1M tokens

速度

Tokens/秒43.5 tokens/s
首Token延迟0.38s
首回答延迟46.36s

可用提供商

(LS 内部计价单位)

暂无提供商数据

外部链接