Перейти к основному содержанию

DeepSeek VL2 Tiny

DeepSeekDeepSeekOpen Weightdeepseek

Описание

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

Дата выхода
2024-12-13
Параметры
3.0B
Длина контекста
164K
Модальности
text

Радар способностей

50
general
0
coding
50
reasoning
34
scienceоцен.
0
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Multimodal Ranking63
69.0
LS

Оценки бенчмарков (LLM Stats)

General

MMT-Bench53.2%Сам.
MMStar45.9%Сам.
MMMU40.7%Сам.

Image To Text

DocVQA88.9%Сам.
OCRBench80.9%Сам.
TextVQA80.7%Сам.

Math

MathVista53.6%Сам.

Multimodal

ChartQA81.0%Сам.
AI2D71.6%Сам.
MMBench69.2%Сам.
MMBench-V1.168.3%Сам.
InfoVQA66.1%Сам.
MME19.1%Сам.

Spatial Reasoning

RealWorldQA64.2%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Image To Text
80
Spatial Reasoning
60
Vision
60
Multimodal
60
Reasoning
60
General
50
Math
50
Healthcare
40

Цены

Цена ввода$0.32 / 1M tokens
Цена вывода$0.89 / 1M tokens
Смешанная цена (3:1)$0.4625 / 1M tokens

Скорость

Нет данных о скорости

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки