DeepSeek VL2 Small
DeepSeekDeepSeekOpen Weightdeepseek
Description
An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.
Date de sortie
2024-12-13
Paramètres
16.0B
Longueur du contexte
164K
Modalités
text
Radar de capacités
60
general
0
coding
60
reasoning
43
scienceest.
0
agents
0
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Multimodal Ranking | 48 | 75.0 | LS |
Scores de benchmarks (LLM Stats)
General
MMT-Bench
62.9%Aut.
MMStar
57.0%Aut.
MMMU
48.0%Aut.
Image To Text
DocVQA
92.3%Aut.
TextVQA
83.4%Aut.
OCRBench
83.4%Aut.
Math
MathVista
60.7%Aut.
Multimodal
ChartQA
84.5%Aut.
MMBench
80.3%Aut.
AI2D
80.0%Aut.
MMBench-V1.1
79.3%Aut.
InfoVQA
75.8%Aut.
MME
21.2%Aut.
Spatial Reasoning
RealWorldQA
65.4%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Image To Text90
Spatial Reasoning70
Vision70
Multimodal70
General60
Math60
Reasoning60
Healthcare50
Tarification
Prix d'entrée$0.32 / 1M tokens
Prix de sortie$0.89 / 1M tokens
Prix mixte (3:1)$0.4625 / 1M tokens
Vitesse
Aucune donnée de vitesse disponible
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible