DeepSeek VL2 Tiny
DeepSeekDeepSeekOpen Weightdeepseek
Описание
An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.
Дата выхода
2024-12-13
Параметры
3.0B
Длина контекста
164K
Модальности
text
Радар способностей
50
general
0
coding
50
reasoning
34
scienceоцен.
0
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Multimodal Ranking | 63 | 69.0 | LS |
Оценки бенчмарков (LLM Stats)
General
MMT-Bench
53.2%Сам.
MMStar
45.9%Сам.
MMMU
40.7%Сам.
Image To Text
DocVQA
88.9%Сам.
OCRBench
80.9%Сам.
TextVQA
80.7%Сам.
Math
MathVista
53.6%Сам.
Multimodal
ChartQA
81.0%Сам.
AI2D
71.6%Сам.
MMBench
69.2%Сам.
MMBench-V1.1
68.3%Сам.
InfoVQA
66.1%Сам.
MME
19.1%Сам.
Spatial Reasoning
RealWorldQA
64.2%Сам.
Индексы оценки AA
Нет данных AA оценки
Оценки категорий LLM Stats
Image To Text80
Spatial Reasoning60
Vision60
Multimodal60
Reasoning60
General50
Math50
Healthcare40
Цены
Цена ввода$0.32 / 1M tokens
Цена вывода$0.89 / 1M tokens
Смешанная цена (3:1)$0.4625 / 1M tokens
Скорость
Нет данных о скорости
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров