Passer au contenu principal

Qwen2.5 VL 7B Instruct

Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Usage Commercial

Description

Qwen2.5-VL is a vision-language model from the Qwen family. Key enhancements include visual understanding (objects, text, charts, layouts), visual agent capabilities (tool use, computer/phone control), long video comprehension with event pinpointing, visual localization (bounding boxes/points), and structured output generation.

Date de sortie
2025-01-26
Paramètres
8.3B
Longueur du contexte
131K
Modalités
image, text

Radar de capacités

50
general
0
coding
50
reasoning
51
scienceest.
50
agents
90
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Capacité agentique27
62.0
LS
Classement multimodal67
71.0
LS
Raisonnement87
53.0
LS

Scores de benchmarks (LLM Stats)

Agents

MobileMiniWob++_SR91.4%Aut.
AITZ_EM81.9%Aut.
AndroidWorld_SR25.5%Aut.

General

MMVet67.1%Aut.
MMStar63.9%Aut.
MMT-Bench63.6%Aut.
MMMU58.6%Aut.
MMMU-Pro38.3%Aut.

Grounding

ScreenSpot84.7%Aut.
ScreenSpot Pro29.0%Aut.

Image To Text

DocVQA95.7%Aut.
OCRBench86.4%Aut.
TextVQA84.9%Aut.

Language

CharadesSTA43.6%Aut.

Long Context

MLVU70.2%Aut.
LongVideoBench54.7%Aut.
LVBench45.3%Aut.

Math

MathVista-Mini68.2%Aut.
MathVision25.1%Aut.

Multimodal

Android Control Low_EM91.4%Aut.
ChartQA87.3%Aut.
MMBench84.3%Aut.
InfoVQA82.6%Aut.
CC-OCR77.8%Aut.
TempCompass71.7%Aut.
VideoMME w sub.71.6%Aut.
PerceptionTest70.5%Aut.
MVBench69.6%Aut.
VideoMME w/o sub.65.1%Aut.
Android Control High_EM60.1%Aut.
MMBench-Video1.8%Aut.

Reasoning

Hallusion Bench52.9%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Image To Text
90
Structured Output
80
Text-to-image
80
Long Context
60
Multimodal
60
Reasoning
60
Spatial Reasoning
60
Grounding
60
Healthcare
60
Vision
60
Math
50
General
50
Agents
50
Video
50
Language
40

Tarification

Prix d'entrée$0.35 / 1M tokens
Prix de sortie$1.05 / 1M tokens
Prix mixte (3:1)$0.525 / 1M tokens

Vitesse

Aucune donnée de vitesse disponible

Classement des Prix par Fournisseur

Classement des Prix par Fournisseur

4 fournisseurs

Moins cher: SiliconFlowPlus cher: Alibaba
FournisseurEntréeSortie
1SiliconFlowMoins cher
$0.05
$0.05
2Alibaba (China)
$0.287
$0.717
3Alibaba Cloud / Qwen TeamPRINCIPAL
$0.35
$1.05
4Alibaba
$0.35
$1.05

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes