메인 콘텐츠로 건너뛰기

Qwen2.5 VL 7B Instruct

Alibaba Cloud / Qwen TeamQwen오픈 웨이트Apache 2.0 · 상업적 사용 가능

설명

Qwen2.5-VL is a vision-language model from the Qwen family. Key enhancements include visual understanding (objects, text, charts, layouts), visual agent capabilities (tool use, computer/phone control), long video comprehension with event pinpointing, visual localization (bounding boxes/points), and structured output generation.

출시일
2025-01-26
파라미터
8.3B
컨텍스트 길이
131K
모달리티
image, text

능력 레이더

50
general
0
coding
50
reasoning
51
science추정
50
agents
90
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
에이전트형 역량27
62.0
LS
멀티모달 랭킹66
71.0
LS
추론87
53.0
LS

벤치마크 점수 (LLM Stats)

Agents

MobileMiniWob++_SR91.4%자체 보고
AITZ_EM81.9%자체 보고
AndroidWorld_SR25.5%자체 보고

General

MMVet67.1%자체 보고
MMStar63.9%자체 보고
MMT-Bench63.6%자체 보고
MMMU58.6%자체 보고
MMMU-Pro38.3%자체 보고

Grounding

ScreenSpot84.7%자체 보고
ScreenSpot Pro29.0%자체 보고

Image To Text

DocVQA95.7%자체 보고
OCRBench86.4%자체 보고
TextVQA84.9%자체 보고

Language

CharadesSTA43.6%자체 보고

Long Context

MLVU70.2%자체 보고
LongVideoBench54.7%자체 보고
LVBench45.3%자체 보고

Math

MathVista-Mini68.2%자체 보고
MathVision25.1%자체 보고

Multimodal

Android Control Low_EM91.4%자체 보고
ChartQA87.3%자체 보고
MMBench84.3%자체 보고
InfoVQA82.6%자체 보고
CC-OCR77.8%자체 보고
TempCompass71.7%자체 보고
VideoMME w sub.71.6%자체 보고
PerceptionTest70.5%자체 보고
MVBench69.6%자체 보고
VideoMME w/o sub.65.1%자체 보고
Android Control High_EM60.1%자체 보고
MMBench-Video1.8%자체 보고

Reasoning

Hallusion Bench52.9%자체 보고

AA 평가 지수

AA 평가 데이터가 없습니다

LLM Stats 카테고리 점수

Image To Text
90
Structured Output
80
Text-to-image
80
Long Context
60
Multimodal
60
Reasoning
60
Spatial Reasoning
60
Grounding
60
Healthcare
60
Vision
60
Math
50
General
50
Agents
50
Video
50
Language
40

가격

입력 가격$0.35 / 1M 토큰
출력 가격$1.05 / 1M 토큰
혼합 가격 (3:1)$0.525 / 1M 토큰

속도

속도 데이터가 없습니다

공급자 가격 순위

공급자 가격 순위

4개 공급자

최저가: SiliconFlow최고가: Alibaba
공급자입력출력
1SiliconFlow최저가
$0.05
$0.05
2Alibaba (China)
$0.287
$0.717
3Alibaba Cloud / Qwen Team주요
$0.35
$1.05
4Alibaba
$0.35
$1.05

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크