DeepSeek VL2
DeepSeekDeepSeekOpen Weightdeepseek
Descripción
An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.
Fecha de lanzamiento
2024-12-13
Parámetros
27.0B
Longitud del contexto
—
Modalidades
image, text
Radar de capacidades
60
general
0
coding
60
reasoning
43
scienceest.
42
agents
90
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Ranking multimodal | 47 | 76.0 | LS |
Puntuaciones de benchmarks (LLM Stats)
General
MMT-Bench
63.6%Aut.
MMStar
61.3%Aut.
MMMU
51.1%Aut.
Image To Text
DocVQA
93.3%Aut.
TextVQA
84.2%Aut.
OCRBench
81.1%Aut.
Math
MathVista
62.8%Aut.
Multimodal
ChartQA
86.0%Aut.
AI2D
81.4%Aut.
MMBench
79.6%Aut.
MMBench-V1.1
79.2%Aut.
InfoVQA
78.1%Aut.
MME
22.5%Aut.
Spatial Reasoning
RealWorldQA
68.4%Aut.
Índices de evaluación AA
No hay datos de evaluación AA disponibles
Puntuaciones por categoría LLM Stats
Image To Text90
Multimodal70
Reasoning70
Spatial Reasoning70
Vision70
Math60
General60
Healthcare50
Precios
No hay datos de precios disponibles
Velocidad
No hay datos de velocidad disponibles
Ranking de Precios por Proveedor
Ranking de Precios por Proveedor
2 proveedores
Más barato: SiliconFlow (China)Más caro: SiliconFlow
ProveedorEntradaSalida
1SiliconFlow (China)Más barato
$0.15
$0.15
2SiliconFlow
$0.15
$0.15
Comparar precios entre diferentes proveedores de API para este modelo.