DeepSeek VL2 Tiny

DeepSeekDeepSeekOpen Weightdeepseek

Description

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

Date de sortie

2024-12-13

Paramètres

3.0B

Longueur du contexte

—

Modalités

—

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement multimodal	72	69.0	LS

Scores de benchmarks (LLM Stats)

General

MMT-Bench

53.2%Aut.

MMStar

45.9%Aut.

MMMU

40.7%Aut.

Image To Text

DocVQA

88.9%Aut.

OCRBench

80.9%Aut.

TextVQA

80.7%Aut.

Math

MathVista

53.6%Aut.

Multimodal

ChartQA

81.0%Aut.

AI2D

71.6%Aut.

MMBench

69.2%Aut.

MMBench-V1.1

68.3%Aut.

InfoVQA

66.1%Aut.

MME

19.1%Aut.

Spatial Reasoning

RealWorldQA

64.2%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Image To Text

Multimodal

Reasoning

Spatial Reasoning

Vision

Math

General

Healthcare

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes

LLM Stats Artificial Analysis