Passer au contenu principal

DeepSeek VL2 Tiny

DeepSeekDeepSeekOpen Weightdeepseek

Description

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

Date de sortie
2024-12-13
Paramètres
3.0B
Longueur du contexte
Modalités

Radar de capacités

50
general
0
coding
50
reasoning
34
scienceest.
35
agents
80
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement multimodal72
69.0
LS

Scores de benchmarks (LLM Stats)

General

MMT-Bench53.2%Aut.
MMStar45.9%Aut.
MMMU40.7%Aut.

Image To Text

DocVQA88.9%Aut.
OCRBench80.9%Aut.
TextVQA80.7%Aut.

Math

MathVista53.6%Aut.

Multimodal

ChartQA81.0%Aut.
AI2D71.6%Aut.
MMBench69.2%Aut.
MMBench-V1.168.3%Aut.
InfoVQA66.1%Aut.
MME19.1%Aut.

Spatial Reasoning

RealWorldQA64.2%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Image To Text
80
Multimodal
60
Reasoning
60
Spatial Reasoning
60
Vision
60
Math
50
General
50
Healthcare
40

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes