Saltar al contenido principal

DeepSeek VL2

DeepSeekDeepSeekOpen Weightdeepseek

Descripción

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

Fecha de lanzamiento
2024-12-13
Parámetros
27.0B
Longitud del contexto
Modalidades
image, text

Radar de capacidades

60
general
0
coding
60
reasoning
43
scienceest.
42
agents
90
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking multimodal47
76.0
LS

Puntuaciones de benchmarks (LLM Stats)

General

MMT-Bench63.6%Aut.
MMStar61.3%Aut.
MMMU51.1%Aut.

Image To Text

DocVQA93.3%Aut.
TextVQA84.2%Aut.
OCRBench81.1%Aut.

Math

MathVista62.8%Aut.

Multimodal

ChartQA86.0%Aut.
AI2D81.4%Aut.
MMBench79.6%Aut.
MMBench-V1.179.2%Aut.
InfoVQA78.1%Aut.
MME22.5%Aut.

Spatial Reasoning

RealWorldQA68.4%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

Image To Text
90
Multimodal
70
Reasoning
70
Spatial Reasoning
70
Vision
70
Math
60
General
60
Healthcare
50

Precios

No hay datos de precios disponibles

Velocidad

No hay datos de velocidad disponibles

Ranking de Precios por Proveedor

Ranking de Precios por Proveedor

2 proveedores

Más barato: SiliconFlow (China)Más caro: SiliconFlow
ProveedorEntradaSalida
1SiliconFlow (China)Más barato
$0.15
$0.15
2SiliconFlow
$0.15
$0.15

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas