Qwen2.5 VL 7B Instruct
Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Usage Commercial
Description
Qwen2.5-VL is a vision-language model from the Qwen family. Key enhancements include visual understanding (objects, text, charts, layouts), visual agent capabilities (tool use, computer/phone control), long video comprehension with event pinpointing, visual localization (bounding boxes/points), and structured output generation.
Date de sortie
2025-01-26
Paramètres
8.3B
Longueur du contexte
131K
Modalités
image, text
Radar de capacités
50
general
0
coding
50
reasoning
51
scienceest.
50
agents
90
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Capacité agentique | 27 | 62.0 | LS |
| Classement multimodal | 67 | 71.0 | LS |
| Raisonnement | 87 | 53.0 | LS |
Scores de benchmarks (LLM Stats)
Agents
MobileMiniWob++_SR
91.4%Aut.
AITZ_EM
81.9%Aut.
AndroidWorld_SR
25.5%Aut.
General
MMVet
67.1%Aut.
MMStar
63.9%Aut.
MMT-Bench
63.6%Aut.
MMMU
58.6%Aut.
MMMU-Pro
38.3%Aut.
Grounding
ScreenSpot
84.7%Aut.
ScreenSpot Pro
29.0%Aut.
Image To Text
DocVQA
95.7%Aut.
OCRBench
86.4%Aut.
TextVQA
84.9%Aut.
Language
CharadesSTA
43.6%Aut.
Long Context
MLVU
70.2%Aut.
LongVideoBench
54.7%Aut.
LVBench
45.3%Aut.
Math
MathVista-Mini
68.2%Aut.
MathVision
25.1%Aut.
Multimodal
Android Control Low_EM
91.4%Aut.
ChartQA
87.3%Aut.
MMBench
84.3%Aut.
InfoVQA
82.6%Aut.
CC-OCR
77.8%Aut.
TempCompass
71.7%Aut.
VideoMME w sub.
71.6%Aut.
PerceptionTest
70.5%Aut.
MVBench
69.6%Aut.
VideoMME w/o sub.
65.1%Aut.
Android Control High_EM
60.1%Aut.
MMBench-Video
1.8%Aut.
Reasoning
Hallusion Bench
52.9%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Image To Text90
Structured Output80
Text-to-image80
Long Context60
Multimodal60
Reasoning60
Spatial Reasoning60
Grounding60
Healthcare60
Vision60
Math50
General50
Agents50
Video50
Language40
Tarification
Prix d'entrée$0.35 / 1M tokens
Prix de sortie$1.05 / 1M tokens
Prix mixte (3:1)$0.525 / 1M tokens
Vitesse
Aucune donnée de vitesse disponible
Classement des Prix par Fournisseur
Classement des Prix par Fournisseur
4 fournisseurs
Moins cher: SiliconFlowPlus cher: Alibaba
FournisseurEntréeSortie
1SiliconFlowMoins cher
$0.05
$0.05
2Alibaba (China)
$0.287
$0.717
3Alibaba Cloud / Qwen TeamPRINCIPAL
$0.35
$1.05
4Alibaba
$0.35
$1.05
Comparer les prix entre différents fournisseurs API pour ce modèle.