メインコンテンツへスキップ

DeepSeek VL2

DeepSeekDeepSeekOpen Weightdeepseek

説明

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

リリース日
2024-12-13
パラメータ
27.0B
コンテキスト長
164K
モダリティ
image, text

能力レーダー

60
general
0
coding
60
reasoning
43
science推定
0
agents
90
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Multimodal Ranking42
76.0
LS

ベンチマークスコア (LLM Stats)

General

MMT-Bench63.6%自己申告
MMStar61.3%自己申告
MMMU51.1%自己申告

Image To Text

DocVQA93.3%自己申告
TextVQA84.2%自己申告
OCRBench81.1%自己申告

Math

MathVista62.8%自己申告

Multimodal

ChartQA86.0%自己申告
AI2D81.4%自己申告
MMBench79.6%自己申告
MMBench-V1.179.2%自己申告
InfoVQA78.1%自己申告
MME22.5%自己申告

Spatial Reasoning

RealWorldQA68.4%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Image To Text
90
Spatial Reasoning
70
Vision
70
Multimodal
70
Reasoning
70
General
60
Math
60
Healthcare
50

価格設定

入力価格$0.32 / 1M tokens
出力価格$0.89 / 1M tokens
混合価格(3:1)$0.4625 / 1M tokens

速度

速度データがありません

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク