DeepSeek VL2
DeepSeekDeepSeekOpen Weightdeepseek
Description
An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.
Date de sortie
2024-12-13
Paramètres
27.0B
Longueur du contexte
—
Modalités
image, text
Radar de capacités
60
general
0
coding
60
reasoning
43
scienceest.
42
agents
90
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Classement multimodal | 47 | 76.0 | LS |
Scores de benchmarks (LLM Stats)
General
MMT-Bench
63.6%Aut.
MMStar
61.3%Aut.
MMMU
51.1%Aut.
Image To Text
DocVQA
93.3%Aut.
TextVQA
84.2%Aut.
OCRBench
81.1%Aut.
Math
MathVista
62.8%Aut.
Multimodal
ChartQA
86.0%Aut.
AI2D
81.4%Aut.
MMBench
79.6%Aut.
MMBench-V1.1
79.2%Aut.
InfoVQA
78.1%Aut.
MME
22.5%Aut.
Spatial Reasoning
RealWorldQA
68.4%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Image To Text90
Multimodal70
Reasoning70
Spatial Reasoning70
Vision70
Math60
General60
Healthcare50
Tarification
Aucune donnée de prix disponible
Vitesse
Aucune donnée de vitesse disponible
Classement des Prix par Fournisseur
Classement des Prix par Fournisseur
2 fournisseurs
Moins cher: SiliconFlow (China)Plus cher: SiliconFlow
FournisseurEntréeSortie
1SiliconFlow (China)Moins cher
$0.15
$0.15
2SiliconFlow
$0.15
$0.15
Comparer les prix entre différents fournisseurs API pour ce modèle.