メインコンテンツへスキップ

DeepSeek VL2 Small

DeepSeekDeepSeekOpen Weightdeepseek

説明

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

リリース日
2024-12-13
パラメータ
16.0B
コンテキスト長
164K
モダリティ
text

能力レーダー

60
general
0
coding
60
reasoning
43
science推定
0
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Multimodal Ranking48
75.0
LS

ベンチマークスコア (LLM Stats)

General

MMT-Bench62.9%自己申告
MMStar57.0%自己申告
MMMU48.0%自己申告

Image To Text

DocVQA92.3%自己申告
TextVQA83.4%自己申告
OCRBench83.4%自己申告

Math

MathVista60.7%自己申告

Multimodal

ChartQA84.5%自己申告
MMBench80.3%自己申告
AI2D80.0%自己申告
MMBench-V1.179.3%自己申告
InfoVQA75.8%自己申告
MME21.2%自己申告

Spatial Reasoning

RealWorldQA65.4%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Image To Text
90
Spatial Reasoning
70
Vision
70
Multimodal
70
General
60
Math
60
Reasoning
60
Healthcare
50

価格設定

入力価格$0.32 / 1M tokens
出力価格$0.89 / 1M tokens
混合価格(3:1)$0.4625 / 1M tokens

速度

速度データがありません

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク