메인 콘텐츠로 건너뛰기

DeepSeek VL2 Small

DeepSeekDeepSeekOpen Weightdeepseek

설명

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

출시일
2024-12-13
파라미터
16.0B
컨텍스트 길이
164K
모달리티
text

능력 레이더

60
general
0
coding
60
reasoning
43
science추정
0
agents
0
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
Multimodal Ranking48
75.0
LS

벤치마크 점수 (LLM Stats)

General

MMT-Bench62.9%자체 보고
MMStar57.0%자체 보고
MMMU48.0%자체 보고

Image To Text

DocVQA92.3%자체 보고
TextVQA83.4%자체 보고
OCRBench83.4%자체 보고

Math

MathVista60.7%자체 보고

Multimodal

ChartQA84.5%자체 보고
MMBench80.3%자체 보고
AI2D80.0%자체 보고
MMBench-V1.179.3%자체 보고
InfoVQA75.8%자체 보고
MME21.2%자체 보고

Spatial Reasoning

RealWorldQA65.4%자체 보고

AA 평가 지수

AA 평가 데이터가 없습니다

LLM Stats 카테고리 점수

Image To Text
90
Spatial Reasoning
70
Vision
70
Multimodal
70
General
60
Math
60
Reasoning
60
Healthcare
50

가격

입력 가격$0.32 / 1M tokens
출력 가격$0.89 / 1M tokens
혼합 가격 (3:1)$0.4625 / 1M tokens

속도

속도 데이터가 없습니다

사용 가능한 프로바이더

(LS 내부 단위)

프로바이더 데이터가 없습니다

외부 링크