Passer au contenu principal

DeepSeek VL2

DeepSeekDeepSeekOpen Weightdeepseek

Description

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

Date de sortie
2024-12-13
Paramètres
27.0B
Longueur du contexte
Modalités
image, text

Radar de capacités

60
general
0
coding
60
reasoning
43
scienceest.
42
agents
90
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement multimodal47
76.0
LS

Scores de benchmarks (LLM Stats)

General

MMT-Bench63.6%Aut.
MMStar61.3%Aut.
MMMU51.1%Aut.

Image To Text

DocVQA93.3%Aut.
TextVQA84.2%Aut.
OCRBench81.1%Aut.

Math

MathVista62.8%Aut.

Multimodal

ChartQA86.0%Aut.
AI2D81.4%Aut.
MMBench79.6%Aut.
MMBench-V1.179.2%Aut.
InfoVQA78.1%Aut.
MME22.5%Aut.

Spatial Reasoning

RealWorldQA68.4%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Image To Text
90
Multimodal
70
Reasoning
70
Spatial Reasoning
70
Vision
70
Math
60
General
60
Healthcare
50

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Classement des Prix par Fournisseur

Classement des Prix par Fournisseur

2 fournisseurs

Moins cher: SiliconFlow (China)Plus cher: SiliconFlow
FournisseurEntréeSortie
1SiliconFlow (China)Moins cher
$0.15
$0.15
2SiliconFlow
$0.15
$0.15

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes