DeepSeek-V2.5 (Dec '24)
DeepSeekDeepSeekOpen Weightdeepseek
विवरण
DeepSeek-V2.5 is an upgraded version that combines DeepSeek-V2-Chat and DeepSeek-Coder-V2-Instruct, integrating general and coding abilities. It better aligns with human preferences and has been optimized in various aspects, including writing and instruction following.
रिलीज़ तिथि
2024-12-10
पैरामीटर
236.0B
संदर्भ लंबाई
164K
मोडैलिटीज़
text
क्षमता रडार
13
general
60
coding
76
reasoning
68
scienceअनुमानित
0
agents
0
multimodal
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| General Ranking | 471 | 14.0 | AA |
| Math Reasoning | 104 | 75.0 | AA |
| Reasoning | 49 | 69.0 | LS |
बेंचमार्क स्कोर (LLM Stats)
Code
HumanEval
89.0%स्वयं
Aider
72.2%स्वयं
SWE-Bench Verified
16.8%स्वयं
Communication
MT-Bench
0.90 / 100स्वयं
Creativity
AlignBench
80.4%स्वयं
Arena Hard
76.2%स्वयं
AlpacaEval 2.0
50.5%स्वयं
Finance
MMLU
80.4%स्वयं
General
DS-FIM-Eval
78.3%स्वयं
LiveCodeBench(01-09)
41.8%स्वयं
Language
BBH
84.3%स्वयं
Math
GSM8k
95.1%स्वयं
MATH
74.7%स्वयं
Reasoning
HumanEval-Mul
73.8%स्वयं
DS-Arena-Code
63.1%स्वयं
AA मूल्यांकन सूचकांक
Intelligence Index12.5
Math 5000.8
LLM Stats श्रेणी स्कोर
Communication90
Roleplay90
Finance80
General80
Healthcare80
Language80
Legal80
Math80
Writing70
Creativity70
Reasoning70
Code60
Frontend Development20
मूल्य निर्धारण
इनपुट मूल्यमुफ्त
आउटपुट मूल्यमुफ्त
मिश्रित मूल्य (3:1)मुफ्त
गति
टोकन/सेकंड0.0 tokens/s
पहले टोकन में देरी0.00s
पहले उत्तर में देरी0.00s
उपलब्ध प्रदाता
(LS आंतरिक इकाइयाँ)कोई प्रदाता डेटा उपलब्ध नहीं