Qwen2.5 VL 32B Instruct

Alibaba Cloud / Qwen TeamQwenओपन वेटApache 2.0 · व्यावसायिक उपयोग

विवरण

Qwen2.5-VL is a vision-language model from the Qwen family. Key enhancements include visual understanding (objects, text, charts, layouts), visual agent capabilities (tool use, computer/phone control), long video comprehension with event pinpointing, visual localization (bounding boxes/points), and structured output generation.

रिलीज़ तिथि

2025-02-28

पैरामीटर

33.5B

संदर्भ लंबाई

—

मोडैलिटीज़

—

क्षमता रडार

general

coding

reasoning

scienceअनुमानित

agents

multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन	#रैंक	स्कोर	स्रोत
एजेंटिक क्षमता	115	33.0	LS
मल्टीमॉडल रैंकिंग	74	66.0	LS

बेंचमार्क स्कोर (LLM Stats)

Agents

AITZ_EM

83.1%स्वयं

AndroidWorld_SR

22.0%स्वयं

OSWorld

5.9%स्वयं

Biology

GPQA

46.0%स्वयं

Code

HumanEval

91.5%स्वयं

Finance

MMLU

78.4%स्वयं

MMLU-Pro

68.8%स्वयं

General

MBPP

0.84 / 100स्वयं

MMMU

70.0%स्वयं

MMStar

69.5%स्वयं

MMMU-Pro

49.5%स्वयं

Grounding

ScreenSpot

88.5%स्वयं

ScreenSpot Pro

39.4%स्वयं

Image To Text

DocVQA

94.8%स्वयं

OCRBench-V2 (zh)

59.1%स्वयं

OCRBench-V2 (en)

57.2%स्वयं

Language

CharadesSTA

54.2%स्वयं

Long Context

LVBench

49.0%स्वयं

Math

MATH

82.2%स्वयं

MathVista-Mini

74.7%स्वयं

MathVision

38.4%स्वयं

Multimodal

Android Control Low_EM

93.3%स्वयं

InfoVQA

83.4%स्वयं

VideoMME w sub.

77.9%स्वयं

CC-OCR

77.1%स्वयं

VideoMME w/o sub.

70.5%स्वयं

Android Control High_EM

69.6%स्वयं

MMBench-Video

1.9%स्वयं

AA मूल्यांकन सूचकांक

कोई AA मूल्यांकन डेटा उपलब्ध नहीं

LLM Stats श्रेणी स्कोर

Code

Structured Output

Text-to-image

Image To Text

Language

Legal

Math

Finance

Healthcare

Multimodal

Reasoning

Spatial Reasoning

Grounding

Vision

Long Context

Physics

General

Biology

Chemistry

Video

Agents

मूल्य निर्धारण

कोई मूल्य डेटा उपलब्ध नहीं

गति

कोई गति डेटा उपलब्ध नहीं

प्रदाता मूल्य रैंकिंग

6 प्रदाता

सबसे सस्ता: IO.NETसबसे महंगा: LLM Gateway

प्रदाताइनपुटआउटपुट

1IO.NETसबसे सस्ता

$0.05

$0.22

2Chutes

$0.0543

$0.2174

3Meganova

$0.2

$0.6

4SiliconFlow (China)

$0.27

5SiliconFlow

$0.27

6LLM Gateway

$1.4

$4.2

इस मॉडल के लिए विभिन्न API प्रदाताओं के मूल्य निर्धारण की तुलना करें।

बाहरी लिंक

LLM Stats Artificial Analysis