DeepSeek VL2 Small
DeepSeekDeepSeekOpen Weightdeepseek
Описание
An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.
Дата выхода
2024-12-13
Параметры
16.0B
Длина контекста
164K
Модальности
text
Радар способностей
60
general
0
coding
60
reasoning
43
scienceоцен.
0
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Multimodal Ranking | 48 | 75.0 | LS |
Оценки бенчмарков (LLM Stats)
General
MMT-Bench
62.9%Сам.
MMStar
57.0%Сам.
MMMU
48.0%Сам.
Image To Text
DocVQA
92.3%Сам.
TextVQA
83.4%Сам.
OCRBench
83.4%Сам.
Math
MathVista
60.7%Сам.
Multimodal
ChartQA
84.5%Сам.
MMBench
80.3%Сам.
AI2D
80.0%Сам.
MMBench-V1.1
79.3%Сам.
InfoVQA
75.8%Сам.
MME
21.2%Сам.
Spatial Reasoning
RealWorldQA
65.4%Сам.
Индексы оценки AA
Нет данных AA оценки
Оценки категорий LLM Stats
Image To Text90
Spatial Reasoning70
Vision70
Multimodal70
General60
Math60
Reasoning60
Healthcare50
Цены
Цена ввода$0.32 / 1M tokens
Цена вывода$0.89 / 1M tokens
Смешанная цена (3:1)$0.4625 / 1M tokens
Скорость
Нет данных о скорости
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров