Перейти к основному содержанию

DeepSeek VL2

DeepSeekDeepSeekОткрытые весаdeepseek

Описание

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

Дата выхода
2024-12-13
Параметры
27.0B
Длина контекста
Модальности
image, text

Радар способностей

60
general
0
coding
60
reasoning
43
scienceоцен.
42
agents
90
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Мультимодальный рейтинг47
76.0
LS

Оценки бенчмарков (LLM Stats)

General

MMT-Bench63.6%Сам.
MMStar61.3%Сам.
MMMU51.1%Сам.

Image To Text

DocVQA93.3%Сам.
TextVQA84.2%Сам.
OCRBench81.1%Сам.

Math

MathVista62.8%Сам.

Multimodal

ChartQA86.0%Сам.
AI2D81.4%Сам.
MMBench79.6%Сам.
MMBench-V1.179.2%Сам.
InfoVQA78.1%Сам.
MME22.5%Сам.

Spatial Reasoning

RealWorldQA68.4%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Image To Text
90
Multimodal
70
Reasoning
70
Spatial Reasoning
70
Vision
70
Math
60
General
60
Healthcare
50

Цены

Нет данных о ценах

Скорость

Нет данных о скорости

Рейтинг цен провайдеров

Рейтинг цен провайдеров

2 провайдеров

Самый дешевый: SiliconFlow (China)Самый дорогой: SiliconFlow
ПровайдерВводВывод
1SiliconFlow (China)Самый дешевый
$0.15
$0.15
2SiliconFlow
$0.15
$0.15

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки