메인 콘텐츠로 건너뛰기

DeepSeek VL2

DeepSeekDeepSeekOpen Weightdeepseek

설명

An advanced series of large Mixture-of-Experts (MoE) Vision-Language Models that significantly improves upon its predecessor, DeepSeek-VL. DeepSeek-VL2 demonstrates superior capabilities across various tasks, including but not limited to visual question answering, optical character recognition, document/table/chart understanding, and visual grounding.

출시일
2024-12-13
파라미터
27.0B
컨텍스트 길이
164K
모달리티
image, text

능력 레이더

60
general
0
coding
60
reasoning
43
science추정
0
agents
90
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
Multimodal Ranking42
76.0
LS

벤치마크 점수 (LLM Stats)

General

MMT-Bench63.6%자체 보고
MMStar61.3%자체 보고
MMMU51.1%자체 보고

Image To Text

DocVQA93.3%자체 보고
TextVQA84.2%자체 보고
OCRBench81.1%자체 보고

Math

MathVista62.8%자체 보고

Multimodal

ChartQA86.0%자체 보고
AI2D81.4%자체 보고
MMBench79.6%자체 보고
MMBench-V1.179.2%자체 보고
InfoVQA78.1%자체 보고
MME22.5%자체 보고

Spatial Reasoning

RealWorldQA68.4%자체 보고

AA 평가 지수

AA 평가 데이터가 없습니다

LLM Stats 카테고리 점수

Image To Text
90
Spatial Reasoning
70
Vision
70
Multimodal
70
Reasoning
70
General
60
Math
60
Healthcare
50

가격

입력 가격$0.32 / 1M tokens
출력 가격$0.89 / 1M tokens
혼합 가격 (3:1)$0.4625 / 1M tokens

속도

속도 데이터가 없습니다

사용 가능한 프로바이더

(LS 내부 단위)

프로바이더 데이터가 없습니다

외부 링크