DeepSeek VL2 Tiny

DeepSeekDeepSeekОткрытые весаdeepseek

Описание

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

Дата выхода

2024-12-13

Параметры

3.0B

Длина контекста

—

Модальности

—

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Мультимодальный рейтинг	72	69.0	LS

Оценки бенчмарков (LLM Stats)

General

MMT-Bench

53.2%Сам.

MMStar

45.9%Сам.

MMMU

40.7%Сам.

Image To Text

DocVQA

88.9%Сам.

OCRBench

80.9%Сам.

TextVQA

80.7%Сам.

Math

MathVista

53.6%Сам.

Multimodal

ChartQA

81.0%Сам.

AI2D

71.6%Сам.

MMBench

69.2%Сам.

MMBench-V1.1

68.3%Сам.

InfoVQA

66.1%Сам.

MME

19.1%Сам.

Spatial Reasoning

RealWorldQA

64.2%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Image To Text

Multimodal

Reasoning

Spatial Reasoning

Vision

Math

General

Healthcare

Цены

Нет данных о ценах

Скорость

Нет данных о скорости

Рейтинг цен провайдеров

Нет данных провайдеров

Внешние ссылки

LLM Stats Artificial Analysis