DeepSeek VL2

DeepSeekDeepSeekOpen Weightdeepseek

Description

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

Date de sortie

2024-12-13

Paramètres

27.0B

Longueur du contexte

—

Modalités

image, text

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement multimodal	47	76.0	LS

Scores de benchmarks (LLM Stats)

General

MMT-Bench

63.6%Aut.

MMStar

61.3%Aut.

MMMU

51.1%Aut.

Image To Text

DocVQA

93.3%Aut.

TextVQA

84.2%Aut.

OCRBench

81.1%Aut.

Math

MathVista

62.8%Aut.

Multimodal

ChartQA

86.0%Aut.

AI2D

81.4%Aut.

MMBench

79.6%Aut.

MMBench-V1.1

79.2%Aut.

InfoVQA

78.1%Aut.

MME

22.5%Aut.

Spatial Reasoning

RealWorldQA

68.4%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Image To Text

Multimodal

Reasoning

Spatial Reasoning

Vision

Math

General

Healthcare

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Classement des Prix par Fournisseur

2 fournisseurs

Moins cher: SiliconFlow (China)Plus cher: SiliconFlow

FournisseurEntréeSortie

1SiliconFlow (China)Moins cher

$0.15

2SiliconFlow

$0.15

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

LLM Stats Artificial Analysis