Qwen2.5 VL 32B Instruct
Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Commercial OK
Описание
Qwen2.5-VL is a vision-language model from the Qwen family. Key enhancements include visual understanding (objects, text, charts, layouts), visual agent capabilities (tool use, computer/phone control), long video comprehension with event pinpointing, visual localization (bounding boxes/points), and structured output generation.
Дата выхода
2025-02-28
Параметры
33.5B
Длина контекста
—
Модальности
—
Радар способностей
50
general
90
coding
70
reasoning
43
scienceоцен.
40
agents
70
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Agents & Tools | 94 | 33.0 | LS |
| Multimodal Ranking | 65 | 66.0 | LS |
Оценки бенчмарков (LLM Stats)
Agents
AITZ_EM
83.1%Сам.
AndroidWorld_SR
22.0%Сам.
OSWorld
5.9%Сам.
Biology
GPQA
46.0%Сам.
Code
HumanEval
91.5%Сам.
Finance
MMLU
78.4%Сам.
MMLU-Pro
68.8%Сам.
General
MBPP
0.84 / 100Сам.
MMMU
70.0%Сам.
MMStar
69.5%Сам.
MMMU-Pro
49.5%Сам.
Grounding
ScreenSpot
88.5%Сам.
ScreenSpot Pro
39.4%Сам.
Image To Text
DocVQA
94.8%Сам.
OCRBench-V2 (zh)
59.1%Сам.
OCRBench-V2 (en)
57.2%Сам.
Language
CharadesSTA
54.2%Сам.
Long Context
LVBench
49.0%Сам.
Math
MATH
82.2%Сам.
MathVista-Mini
74.7%Сам.
MathVision
38.4%Сам.
Multimodal
Android Control Low_EM
93.3%Сам.
InfoVQA
83.4%Сам.
VideoMME w sub.
77.9%Сам.
CC-OCR
77.1%Сам.
VideoMME w/o sub.
70.5%Сам.
Android Control High_EM
69.6%Сам.
MMBench-Video
1.9%Сам.
Индексы оценки AA
Нет данных AA оценки
Оценки категорий LLM Stats
Code90
Structured Output80
Text-to-image80
Finance70
Healthcare70
Image To Text70
Language70
Legal70
Math70
Spatial Reasoning60
Vision60
Grounding60
Multimodal60
Reasoning60
Video50
Biology50
Chemistry50
General50
Long Context50
Physics50
Agents40
Цены
Нет данных о ценах
Скорость
Нет данных о скорости
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров