DeepSeek VL2
DeepSeekDeepSeekОткрытые весаdeepseek
Описание
An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.
Дата выхода
2024-12-13
Параметры
27.0B
Длина контекста
—
Модальности
image, text
Радар способностей
60
general
0
coding
60
reasoning
43
scienceоцен.
42
agents
90
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Мультимодальный рейтинг | 47 | 76.0 | LS |
Оценки бенчмарков (LLM Stats)
General
MMT-Bench
63.6%Сам.
MMStar
61.3%Сам.
MMMU
51.1%Сам.
Image To Text
DocVQA
93.3%Сам.
TextVQA
84.2%Сам.
OCRBench
81.1%Сам.
Math
MathVista
62.8%Сам.
Multimodal
ChartQA
86.0%Сам.
AI2D
81.4%Сам.
MMBench
79.6%Сам.
MMBench-V1.1
79.2%Сам.
InfoVQA
78.1%Сам.
MME
22.5%Сам.
Spatial Reasoning
RealWorldQA
68.4%Сам.
Индексы оценки AA
Нет данных AA оценки
Оценки категорий LLM Stats
Image To Text90
Multimodal70
Reasoning70
Spatial Reasoning70
Vision70
Math60
General60
Healthcare50
Цены
Нет данных о ценах
Скорость
Нет данных о скорости
Рейтинг цен провайдеров
Рейтинг цен провайдеров
2 провайдеров
Самый дешевый: SiliconFlow (China)Самый дорогой: SiliconFlow
ПровайдерВводВывод
1SiliconFlow (China)Самый дешевый
$0.15
$0.15
2SiliconFlow
$0.15
$0.15
Сравнение цен разных API-провайдеров для этой модели.