DeepSeek VL2 Tiny
DeepSeekDeepSeekOpen Weightdeepseek
説明
An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.
リリース日
2024-12-13
パラメータ
3.0B
コンテキスト長
164K
モダリティ
text
能力レーダー
50
general
0
coding
50
reasoning
34
science推定
0
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Multimodal Ranking | 63 | 69.0 | LS |
ベンチマークスコア (LLM Stats)
General
MMT-Bench
53.2%自己申告
MMStar
45.9%自己申告
MMMU
40.7%自己申告
Image To Text
DocVQA
88.9%自己申告
OCRBench
80.9%自己申告
TextVQA
80.7%自己申告
Math
MathVista
53.6%自己申告
Multimodal
ChartQA
81.0%自己申告
AI2D
71.6%自己申告
MMBench
69.2%自己申告
MMBench-V1.1
68.3%自己申告
InfoVQA
66.1%自己申告
MME
19.1%自己申告
Spatial Reasoning
RealWorldQA
64.2%自己申告
AA評価指数
AA評価データがありません
LLM Statsカテゴリスコア
Image To Text80
Spatial Reasoning60
Vision60
Multimodal60
Reasoning60
General50
Math50
Healthcare40
価格設定
入力価格$0.32 / 1M tokens
出力価格$0.89 / 1M tokens
混合価格(3:1)$0.4625 / 1M tokens
速度
速度データがありません
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません