मुख्य सामग्री पर जाएं

DeepSeek VL2

DeepSeekDeepSeekOpen Weightdeepseek

विवरण

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

रिलीज़ तिथि
2024-12-13
पैरामीटर
27.0B
संदर्भ लंबाई
164K
मोडैलिटीज़
image, text

क्षमता रडार

60
general
0
coding
60
reasoning
43
scienceअनुमानित
0
agents
90
multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन#रैंकस्कोरस्रोत
Multimodal Ranking42
76.0
LS

बेंचमार्क स्कोर (LLM Stats)

General

MMT-Bench63.6%स्वयं
MMStar61.3%स्वयं
MMMU51.1%स्वयं

Image To Text

DocVQA93.3%स्वयं
TextVQA84.2%स्वयं
OCRBench81.1%स्वयं

Math

MathVista62.8%स्वयं

Multimodal

ChartQA86.0%स्वयं
AI2D81.4%स्वयं
MMBench79.6%स्वयं
MMBench-V1.179.2%स्वयं
InfoVQA78.1%स्वयं
MME22.5%स्वयं

Spatial Reasoning

RealWorldQA68.4%स्वयं

AA मूल्यांकन सूचकांक

कोई AA मूल्यांकन डेटा उपलब्ध नहीं

LLM Stats श्रेणी स्कोर

Image To Text
90
Spatial Reasoning
70
Vision
70
Multimodal
70
Reasoning
70
General
60
Math
60
Healthcare
50

मूल्य निर्धारण

इनपुट मूल्य$0.32 / 1M tokens
आउटपुट मूल्य$0.89 / 1M tokens
मिश्रित मूल्य (3:1)$0.4625 / 1M tokens

गति

कोई गति डेटा उपलब्ध नहीं

उपलब्ध प्रदाता

(LS आंतरिक इकाइयाँ)

कोई प्रदाता डेटा उपलब्ध नहीं

बाहरी लिंक