메인 콘텐츠로 건너뛰기

DeepSeek VL2 Tiny

DeepSeekDeepSeekOpen Weightdeepseek

설명

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

출시일
2024-12-13
파라미터
3.0B
컨텍스트 길이
164K
모달리티
text

능력 레이더

50
general
0
coding
50
reasoning
34
science추정
0
agents
0
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
Multimodal Ranking63
69.0
LS

벤치마크 점수 (LLM Stats)

General

MMT-Bench53.2%자체 보고
MMStar45.9%자체 보고
MMMU40.7%자체 보고

Image To Text

DocVQA88.9%자체 보고
OCRBench80.9%자체 보고
TextVQA80.7%자체 보고

Math

MathVista53.6%자체 보고

Multimodal

ChartQA81.0%자체 보고
AI2D71.6%자체 보고
MMBench69.2%자체 보고
MMBench-V1.168.3%자체 보고
InfoVQA66.1%자체 보고
MME19.1%자체 보고

Spatial Reasoning

RealWorldQA64.2%자체 보고

AA 평가 지수

AA 평가 데이터가 없습니다

LLM Stats 카테고리 점수

Image To Text
80
Spatial Reasoning
60
Vision
60
Multimodal
60
Reasoning
60
General
50
Math
50
Healthcare
40

가격

입력 가격$0.32 / 1M tokens
출력 가격$0.89 / 1M tokens
혼합 가격 (3:1)$0.4625 / 1M tokens

속도

속도 데이터가 없습니다

사용 가능한 프로바이더

(LS 내부 단위)

프로바이더 데이터가 없습니다

외부 링크