DeepSeek VL2

DeepSeekDeepSeekОткрытые весаdeepseek

Описание

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

Дата выхода

2024-12-13

Параметры

27.0B

Длина контекста

—

Модальности

image, text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Мультимодальный рейтинг	47	76.0	LS

Оценки бенчмарков (LLM Stats)

General

MMT-Bench

63.6%Сам.

MMStar

61.3%Сам.

MMMU

51.1%Сам.

Image To Text

DocVQA

93.3%Сам.

TextVQA

84.2%Сам.

OCRBench

81.1%Сам.

Math

MathVista

62.8%Сам.

Multimodal

ChartQA

86.0%Сам.

AI2D

81.4%Сам.

MMBench

79.6%Сам.

MMBench-V1.1

79.2%Сам.

InfoVQA

78.1%Сам.

MME

22.5%Сам.

Spatial Reasoning

RealWorldQA

68.4%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Image To Text

Multimodal

Reasoning

Spatial Reasoning

Vision

Math

General

Healthcare

Цены

Нет данных о ценах

Скорость

Нет данных о скорости

Рейтинг цен провайдеров

2 провайдеров

Самый дешевый: SiliconFlow (China)Самый дорогой: SiliconFlow

ПровайдерВводВывод

1SiliconFlow (China)Самый дешевый

$0.15

2SiliconFlow

$0.15

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis