DeepSeek VL2 Small
DeepSeekDeepSeekOpen Weightdeepseek
Description
An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.
Date de sortie
2024-12-13
Paramètres
16.0B
Longueur du contexte
—
Modalités
—
Radar de capacités
60
general
0
coding
60
reasoning
43
scienceest.
42
agents
90
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Classement multimodal | 53 | 75.0 | LS |
Scores de benchmarks (LLM Stats)
General
MMT-Bench
62.9%Aut.
MMStar
57.0%Aut.
MMMU
48.0%Aut.
Image To Text
DocVQA
92.3%Aut.
TextVQA
83.4%Aut.
OCRBench
83.4%Aut.
Math
MathVista
60.7%Aut.
Multimodal
ChartQA
84.5%Aut.
MMBench
80.3%Aut.
AI2D
80.0%Aut.
MMBench-V1.1
79.3%Aut.
InfoVQA
75.8%Aut.
MME
21.2%Aut.
Spatial Reasoning
RealWorldQA
65.4%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Image To Text90
Multimodal70
Spatial Reasoning70
Vision70
Math60
Reasoning60
General60
Healthcare50
Tarification
Aucune donnée de prix disponible
Vitesse
Aucune donnée de vitesse disponible
Classement des Prix par Fournisseur
Aucune donnée de fournisseur disponible