Passer au contenu principal

Qwen2.5 VL 32B Instruct

Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Commercial OK

Description

Qwen2.5-VL is a vision-language model from the Qwen family. Key enhancements include visual understanding (objects, text, charts, layouts), visual agent capabilities (tool use, computer/phone control), long video comprehension with event pinpointing, visual localization (bounding boxes/points), and structured output generation.

Date de sortie
2025-02-28
Paramètres
33.5B
Longueur du contexte
Modalités

Radar de capacités

50
general
90
coding
70
reasoning
43
scienceest.
40
agents
70
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Agents & Tools94
33.0
LS
Multimodal Ranking65
66.0
LS

Scores de benchmarks (LLM Stats)

Agents

AITZ_EM83.1%Aut.
AndroidWorld_SR22.0%Aut.
OSWorld5.9%Aut.

Biology

GPQA46.0%Aut.

Code

HumanEval91.5%Aut.

Finance

MMLU78.4%Aut.
MMLU-Pro68.8%Aut.

General

MBPP0.84 / 100Aut.
MMMU70.0%Aut.
MMStar69.5%Aut.
MMMU-Pro49.5%Aut.

Grounding

ScreenSpot88.5%Aut.
ScreenSpot Pro39.4%Aut.

Image To Text

DocVQA94.8%Aut.
OCRBench-V2 (zh)59.1%Aut.
OCRBench-V2 (en)57.2%Aut.

Language

CharadesSTA54.2%Aut.

Long Context

LVBench49.0%Aut.

Math

MATH82.2%Aut.
MathVista-Mini74.7%Aut.
MathVision38.4%Aut.

Multimodal

Android Control Low_EM93.3%Aut.
InfoVQA83.4%Aut.
VideoMME w sub.77.9%Aut.
CC-OCR77.1%Aut.
VideoMME w/o sub.70.5%Aut.
Android Control High_EM69.6%Aut.
MMBench-Video1.9%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Code
90
Structured Output
80
Text-to-image
80
Finance
70
Healthcare
70
Image To Text
70
Language
70
Legal
70
Math
70
Spatial Reasoning
60
Vision
60
Grounding
60
Multimodal
60
Reasoning
60
Video
50
Biology
50
Chemistry
50
General
50
Long Context
50
Physics
50
Agents
40

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes