DeepSeek VL2 Tiny
DeepSeekDeepSeekOpen Weightdeepseek
Description
An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.
Date de sortie
2024-12-13
Paramètres
3.0B
Longueur du contexte
164K
Modalités
text
Radar de capacités
50
general
0
coding
50
reasoning
34
scienceest.
0
agents
0
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Multimodal Ranking | 63 | 69.0 | LS |
Scores de benchmarks (LLM Stats)
General
MMT-Bench
53.2%Aut.
MMStar
45.9%Aut.
MMMU
40.7%Aut.
Image To Text
DocVQA
88.9%Aut.
OCRBench
80.9%Aut.
TextVQA
80.7%Aut.
Math
MathVista
53.6%Aut.
Multimodal
ChartQA
81.0%Aut.
AI2D
71.6%Aut.
MMBench
69.2%Aut.
MMBench-V1.1
68.3%Aut.
InfoVQA
66.1%Aut.
MME
19.1%Aut.
Spatial Reasoning
RealWorldQA
64.2%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Image To Text80
Spatial Reasoning60
Vision60
Multimodal60
Reasoning60
General50
Math50
Healthcare40
Tarification
Prix d'entrée$0.32 / 1M tokens
Prix de sortie$0.89 / 1M tokens
Prix mixte (3:1)$0.4625 / 1M tokens
Vitesse
Aucune donnée de vitesse disponible
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible