跳轉到主要內容

DeepSeek VL2 Tiny

DeepSeekDeepSeekOpen Weightdeepseek

描述

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

發布日期
2024-12-13
參數規模
3.0B
上下文長度
164K
支援模態
text

能力雷達圖

50
general
0
coding
50
reasoning
34
science估算
0
agents
0
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域#排名分數來源
多模态榜63
69.0
LS

基準測試分數 (LLM Stats)

General

MMT-Bench53.2%自報
MMStar45.9%自報
MMMU40.7%自報

Image To Text

DocVQA88.9%自報
OCRBench80.9%自報
TextVQA80.7%自報

Math

MathVista53.6%自報

Multimodal

ChartQA81.0%自報
AI2D71.6%自報
MMBench69.2%自報
MMBench-V1.168.3%自報
InfoVQA66.1%自報
MME19.1%自報

Spatial Reasoning

RealWorldQA64.2%自報

AA 評測指數

暫無 AA 評測資料

LLM Stats 分類評分

Image To Text
80
Spatial Reasoning
60
Vision
60
Multimodal
60
Reasoning
60
General
50
Math
50
Healthcare
40

定價

輸入價格$0.32 / 1M tokens
輸出價格$0.89 / 1M tokens
混合價格(3:1)$0.4625 / 1M tokens

速度

暫無速度資料

可用提供商

(LS 內部計價單位)

暫無提供商資料

外部連結