DeepSeek VL2 Tiny
DeepSeekDeepSeekOpen Weightdeepseek
Descripción
An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.
Fecha de lanzamiento
2024-12-13
Parámetros
3.0B
Longitud del contexto
164K
Modalidades
text
Radar de capacidades
50
general
0
coding
50
reasoning
34
scienceest.
0
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Multimodal Ranking | 63 | 69.0 | LS |
Puntuaciones de benchmarks (LLM Stats)
General
MMT-Bench
53.2%Aut.
MMStar
45.9%Aut.
MMMU
40.7%Aut.
Image To Text
DocVQA
88.9%Aut.
OCRBench
80.9%Aut.
TextVQA
80.7%Aut.
Math
MathVista
53.6%Aut.
Multimodal
ChartQA
81.0%Aut.
AI2D
71.6%Aut.
MMBench
69.2%Aut.
MMBench-V1.1
68.3%Aut.
InfoVQA
66.1%Aut.
MME
19.1%Aut.
Spatial Reasoning
RealWorldQA
64.2%Aut.
Índices de evaluación AA
No hay datos de evaluación AA disponibles
Puntuaciones por categoría LLM Stats
Image To Text80
Spatial Reasoning60
Vision60
Multimodal60
Reasoning60
General50
Math50
Healthcare40
Precios
Precio de entrada$0.32 / 1M tokens
Precio de salida$0.89 / 1M tokens
Precio mixto (3:1)$0.4625 / 1M tokens
Velocidad
No hay datos de velocidad disponibles
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles