DeepSeek VL2
DeepSeekDeepSeekOpen Weightdeepseek
Descripción
An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.
Fecha de lanzamiento
2024-12-13
Parámetros
27.0B
Longitud del contexto
164K
Modalidades
image, text
Radar de capacidades
60
general
0
coding
60
reasoning
43
scienceest.
0
agents
90
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Multimodal Ranking | 42 | 76.0 | LS |
Puntuaciones de benchmarks (LLM Stats)
General
MMT-Bench
63.6%Aut.
MMStar
61.3%Aut.
MMMU
51.1%Aut.
Image To Text
DocVQA
93.3%Aut.
TextVQA
84.2%Aut.
OCRBench
81.1%Aut.
Math
MathVista
62.8%Aut.
Multimodal
ChartQA
86.0%Aut.
AI2D
81.4%Aut.
MMBench
79.6%Aut.
MMBench-V1.1
79.2%Aut.
InfoVQA
78.1%Aut.
MME
22.5%Aut.
Spatial Reasoning
RealWorldQA
68.4%Aut.
Índices de evaluación AA
No hay datos de evaluación AA disponibles
Puntuaciones por categoría LLM Stats
Image To Text90
Spatial Reasoning70
Vision70
Multimodal70
Reasoning70
General60
Math60
Healthcare50
Precios
Precio de entrada$0.32 / 1M tokens
Precio de salida$0.89 / 1M tokens
Precio mixto (3:1)$0.4625 / 1M tokens
Velocidad
No hay datos de velocidad disponibles
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles