DeepSeek R1 Distill Qwen 14B

DeepSeekDeepSeekओपन वेटMIT · व्यावसायिक उपयोग

विवरण

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

रिलीज़ तिथि

2025-01-20

पैरामीटर

14.8B

संदर्भ लंबाई

—

मोडैलिटीज़

—

क्षमता रडार

general

coding

reasoning

scienceअनुमानित

agents

multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन	#रैंक	स्कोर	स्रोत
कोडिंग रैंकिंग	328	25.0	AA
सामान्य रैंकिंग	356	31.0	AA
गणितीय तर्क	132	67.0	AA
विज्ञान	367	31.0	AA

बेंचमार्क स्कोर (LLM Stats)

Biology

GPQA

59.1%स्वयं

Code

LiveCodeBench

53.1%स्वयं

Math

MATH-500

93.9%स्वयं

AIME 2024

80.0%स्वयं

AA मूल्यांकन सूचकांक

Math Index

55.7

Intelligence Index

9.8

Math 500

0.9

Mmlu Pro

0.7

Aime

0.7

Aime 25

0.6

Gpqa

0.5

Livecodebench

0.4

Scicode

0.2

Ifbench

0.2

Lcr

0.1

Hle

0.0

LLM Stats श्रेणी स्कोर

Math

Reasoning

Physics

General

Biology

Chemistry

Code

मूल्य निर्धारण

इनपुट मूल्यमुफ्त

आउटपुट मूल्यमुफ्त

मिश्रित मूल्य (3:1)मुफ्त

गति

टोकन/सेकंड0.0

पहले टोकन में देरी0.00s

पहले उत्तर में देरी0.00s

प्रदाता मूल्य रैंकिंग

4 प्रदाता

सबसे सस्ता: SiliconFlow (China)सबसे महंगा: NovitaAI

प्रदाताइनपुटआउटपुट

1SiliconFlow (China)सबसे सस्ता

$0.1

2SiliconFlow

$0.1

3Alibaba (China)

$0.144

$0.431

4NovitaAI

$0.15

इस मॉडल के लिए विभिन्न API प्रदाताओं के मूल्य निर्धारण की तुलना करें।

बाहरी लिंक

LLM Stats Artificial Analysis