DeepSeek VL2 Small

DeepSeekDeepSeekОткрытые весаdeepseek

Описание

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

Дата выхода

2024-12-13

Параметры

16.0B

Длина контекста

—

Модальности

—

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Мультимодальный рейтинг	53	75.0	LS

Оценки бенчмарков (LLM Stats)

General

MMT-Bench

62.9%Сам.

MMStar

57.0%Сам.

MMMU

48.0%Сам.

Image To Text

DocVQA

92.3%Сам.

TextVQA

83.4%Сам.

OCRBench

83.4%Сам.

Math

MathVista

60.7%Сам.

Multimodal

ChartQA

84.5%Сам.

MMBench

80.3%Сам.

AI2D

80.0%Сам.

MMBench-V1.1

79.3%Сам.

InfoVQA

75.8%Сам.

MME

21.2%Сам.

Spatial Reasoning

RealWorldQA

65.4%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Image To Text

Multimodal

Spatial Reasoning

Vision

Math

Reasoning

General

Healthcare

Цены

Нет данных о ценах

Скорость

Нет данных о скорости

Рейтинг цен провайдеров

Нет данных провайдеров

Внешние ссылки

LLM Stats Artificial Analysis