DeepSeek-V2-Chat
DeepSeekDeepSeek
विवरण
DeepSeek-V2.5 is an upgraded version that combines DeepSeek-V2-Chat and DeepSeek-Coder-V2-Instruct, integrating general and coding abilities. It better aligns with human preferences and has been optimized in various aspects, including writing and instruction following.
रिलीज़ तिथि
2024-05-06
पैरामीटर
—
संदर्भ लंबाई
—
मोडैलिटीज़
—
क्षमता रडार
4
general
60
coding
80
reasoning
68
scienceअनुमानित
74
agents
0
multimodal
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| सामान्य रैंकिंग | 526 | 4.0 | AA |
| तर्क | 53 | 69.0 | LS |
बेंचमार्क स्कोर (LLM Stats)
Code
HumanEval
89.0%स्वयं
Aider
72.2%स्वयं
SWE-Bench Verified
16.8%स्वयं
Communication
MT-Bench
0.90 / 100स्वयं
Creativity
AlignBench
80.4%स्वयं
Arena Hard
76.2%स्वयं
AlpacaEval 2.0
50.5%स्वयं
Finance
MMLU
80.4%स्वयं
General
DS-FIM-Eval
78.3%स्वयं
LiveCodeBench(01-09)
41.8%स्वयं
Language
BBH
84.3%स्वयं
Math
GSM8k
95.1%स्वयं
MATH
74.7%स्वयं
Reasoning
HumanEval-Mul
73.8%स्वयं
DS-Arena-Code
63.1%स्वयं
AA मूल्यांकन सूचकांक
Intelligence Index3.6
LLM Stats श्रेणी स्कोर
Roleplay90
Communication90
Language80
Legal80
Math80
Finance80
General80
Healthcare80
Reasoning70
Creativity70
Writing70
Code60
Frontend Development20
मूल्य निर्धारण
इनपुट मूल्यमुफ्त
आउटपुट मूल्यमुफ्त
मिश्रित मूल्य (3:1)मुफ्त
गति
टोकन/सेकंड0.0
पहले टोकन में देरी0.00s
पहले उत्तर में देरी0.00s
प्रदाता मूल्य रैंकिंग
कोई प्रदाता डेटा उपलब्ध नहीं