DeepSeek VL2

DeepSeekDeepSeekOpen Weightdeepseek

Descripción

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

Fecha de lanzamiento

2024-12-13

Parámetros

27.0B

Longitud del contexto

—

Modalidades

image, text

Radar de capacidades

general

coding

reasoning

scienceest.

agents

multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio	#Posición	Puntuación	Fuente
Ranking multimodal	47	76.0	LS

Puntuaciones de benchmarks (LLM Stats)

General

MMT-Bench

63.6%Aut.

MMStar

61.3%Aut.

MMMU

51.1%Aut.

Image To Text

DocVQA

93.3%Aut.

TextVQA

84.2%Aut.

OCRBench

81.1%Aut.

Math

MathVista

62.8%Aut.

Multimodal

ChartQA

86.0%Aut.

AI2D

81.4%Aut.

MMBench

79.6%Aut.

MMBench-V1.1

79.2%Aut.

InfoVQA

78.1%Aut.

MME

22.5%Aut.

Spatial Reasoning

RealWorldQA

68.4%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

Image To Text

Multimodal

Reasoning

Spatial Reasoning

Vision

Math

General

Healthcare

Precios

No hay datos de precios disponibles

Velocidad

No hay datos de velocidad disponibles

Ranking de Precios por Proveedor

2 proveedores

Más barato: SiliconFlow (China)Más caro: SiliconFlow

ProveedorEntradaSalida

1SiliconFlow (China)Más barato

$0.15

2SiliconFlow

$0.15

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas

LLM Stats Artificial Analysis