Saltar al contenido principal

DeepSeek VL2 Tiny

DeepSeekDeepSeekOpen Weightdeepseek

Descripción

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

Fecha de lanzamiento
2024-12-13
Parámetros
3.0B
Longitud del contexto
Modalidades

Radar de capacidades

50
general
0
coding
50
reasoning
34
scienceest.
35
agents
80
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking multimodal72
69.0
LS

Puntuaciones de benchmarks (LLM Stats)

General

MMT-Bench53.2%Aut.
MMStar45.9%Aut.
MMMU40.7%Aut.

Image To Text

DocVQA88.9%Aut.
OCRBench80.9%Aut.
TextVQA80.7%Aut.

Math

MathVista53.6%Aut.

Multimodal

ChartQA81.0%Aut.
AI2D71.6%Aut.
MMBench69.2%Aut.
MMBench-V1.168.3%Aut.
InfoVQA66.1%Aut.
MME19.1%Aut.

Spatial Reasoning

RealWorldQA64.2%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

Image To Text
80
Multimodal
60
Reasoning
60
Spatial Reasoning
60
Vision
60
Math
50
General
50
Healthcare
40

Precios

No hay datos de precios disponibles

Velocidad

No hay datos de velocidad disponibles

Ranking de Precios por Proveedor

No hay datos de proveedores disponibles

Fuentes externas