メインコンテンツへスキップ

DeepSeek VL2 Tiny

DeepSeekDeepSeekOpen Weightdeepseek

説明

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

リリース日
2024-12-13
パラメータ
3.0B
コンテキスト長
164K
モダリティ
text

能力レーダー

50
general
0
coding
50
reasoning
34
science推定
0
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Multimodal Ranking63
69.0
LS

ベンチマークスコア (LLM Stats)

General

MMT-Bench53.2%自己申告
MMStar45.9%自己申告
MMMU40.7%自己申告

Image To Text

DocVQA88.9%自己申告
OCRBench80.9%自己申告
TextVQA80.7%自己申告

Math

MathVista53.6%自己申告

Multimodal

ChartQA81.0%自己申告
AI2D71.6%自己申告
MMBench69.2%自己申告
MMBench-V1.168.3%自己申告
InfoVQA66.1%自己申告
MME19.1%自己申告

Spatial Reasoning

RealWorldQA64.2%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Image To Text
80
Spatial Reasoning
60
Vision
60
Multimodal
60
Reasoning
60
General
50
Math
50
Healthcare
40

価格設定

入力価格$0.32 / 1M tokens
出力価格$0.89 / 1M tokens
混合価格(3:1)$0.4625 / 1M tokens

速度

速度データがありません

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク