DeepSeek VL2
DeepSeekDeepSeekOpen Weightdeepseek
説明
An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.
リリース日
2024-12-13
パラメータ
27.0B
コンテキスト長
164K
モダリティ
image, text
能力レーダー
60
general
0
coding
60
reasoning
43
science推定
0
agents
90
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Multimodal Ranking | 42 | 76.0 | LS |
ベンチマークスコア (LLM Stats)
General
MMT-Bench
63.6%自己申告
MMStar
61.3%自己申告
MMMU
51.1%自己申告
Image To Text
DocVQA
93.3%自己申告
TextVQA
84.2%自己申告
OCRBench
81.1%自己申告
Math
MathVista
62.8%自己申告
Multimodal
ChartQA
86.0%自己申告
AI2D
81.4%自己申告
MMBench
79.6%自己申告
MMBench-V1.1
79.2%自己申告
InfoVQA
78.1%自己申告
MME
22.5%自己申告
Spatial Reasoning
RealWorldQA
68.4%自己申告
AA評価指数
AA評価データがありません
LLM Statsカテゴリスコア
Image To Text90
Spatial Reasoning70
Vision70
Multimodal70
Reasoning70
General60
Math60
Healthcare50
価格設定
入力価格$0.32 / 1M tokens
出力価格$0.89 / 1M tokens
混合価格(3:1)$0.4625 / 1M tokens
速度
速度データがありません
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません