DeepSeek VL2 Tiny
DeepSeekDeepSeekOpen Weightdeepseek
Description
An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.
Date de sortie
2024-12-13
Paramètres
3.0B
Longueur du contexte
—
Modalités
—
Radar de capacités
50
general
0
coding
50
reasoning
34
scienceest.
35
agents
80
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Classement multimodal | 72 | 69.0 | LS |
Scores de benchmarks (LLM Stats)
General
MMT-Bench
53.2%Aut.
MMStar
45.9%Aut.
MMMU
40.7%Aut.
Image To Text
DocVQA
88.9%Aut.
OCRBench
80.9%Aut.
TextVQA
80.7%Aut.
Math
MathVista
53.6%Aut.
Multimodal
ChartQA
81.0%Aut.
AI2D
71.6%Aut.
MMBench
69.2%Aut.
MMBench-V1.1
68.3%Aut.
InfoVQA
66.1%Aut.
MME
19.1%Aut.
Spatial Reasoning
RealWorldQA
64.2%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Image To Text80
Multimodal60
Reasoning60
Spatial Reasoning60
Vision60
Math50
General50
Healthcare40
Tarification
Aucune donnée de prix disponible
Vitesse
Aucune donnée de vitesse disponible
Classement des Prix par Fournisseur
Aucune donnée de fournisseur disponible