Passer au contenu principal

DeepSeek VL2 Small

DeepSeekDeepSeekOpen Weightdeepseek

Description

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

Date de sortie
2024-12-13
Paramètres
16.0B
Longueur du contexte
164K
Modalités
text

Radar de capacités

60
general
0
coding
60
reasoning
43
scienceest.
0
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Multimodal Ranking48
75.0
LS

Scores de benchmarks (LLM Stats)

General

MMT-Bench62.9%Aut.
MMStar57.0%Aut.
MMMU48.0%Aut.

Image To Text

DocVQA92.3%Aut.
TextVQA83.4%Aut.
OCRBench83.4%Aut.

Math

MathVista60.7%Aut.

Multimodal

ChartQA84.5%Aut.
MMBench80.3%Aut.
AI2D80.0%Aut.
MMBench-V1.179.3%Aut.
InfoVQA75.8%Aut.
MME21.2%Aut.

Spatial Reasoning

RealWorldQA65.4%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Image To Text
90
Spatial Reasoning
70
Vision
70
Multimodal
70
General
60
Math
60
Reasoning
60
Healthcare
50

Tarification

Prix d'entrée$0.32 / 1M tokens
Prix de sortie$0.89 / 1M tokens
Prix mixte (3:1)$0.4625 / 1M tokens

Vitesse

Aucune donnée de vitesse disponible

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes