跳轉到主要內容

DeepSeek R1 Distill Qwen 7B

DeepSeekDeepSeekOpen WeightMIT · Commercial OK

描述

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

發布日期
2025-01-20
參數規模
7.6B
上下文長度
支援模態

能力雷達圖

40
general
40
coding
90
reasoning
43
science估算
0
agents
0
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

暫無排名資料

基準測試分數 (LLM Stats)

Biology

GPQA49.1%自報

Code

LiveCodeBench37.6%自報

Math

MATH-50092.8%自報
AIME 202483.3%自報

AA 評測指數

暫無 AA 評測資料

LLM Stats 分類評分

Math
90
Reasoning
70
Biology
50
Chemistry
50
Physics
50
Code
40
General
40

定價

暫無定價資料

速度

暫無速度資料

可用提供商

(LS 內部計價單位)

暫無提供商資料

外部連結