Passer au contenu principal

Qwen2.5 VL 72B Instruct

Alibaba Cloud / Qwen TeamQwenOpen Weighttongyi-qianwen

Description

Qwen2.5-VL is the new flagship vision-language model of Qwen, significantly improved from Qwen2-VL. It excels at recognizing objects, analyzing text/charts/layouts in images, acting as a visual agent, understanding long videos (over 1 hour) with event pinpointing, performing visual localization (bounding boxes/points), and generating structured outputs from documents.

Date de sortie
2025-01-26
Paramètres
72.0B
Longueur du contexte
131K
Modalités
image, text

Radar de capacités

50
general
0
coding
60
reasoning
60
scienceest.
40
agents
80
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Capacité agentique98
45.0
LS
Classement multimodal59
73.0
LS
Raisonnement79
55.0
LS

Scores de benchmarks (LLM Stats)

Agents

AITZ_EM83.2%Aut.
MobileMiniWob++_SR68.0%Aut.
AndroidWorld_SR35.0%Aut.
OSWorld8.8%Aut.

General

MMVet76.2%Aut.
MLVU-M74.6%Aut.
MMStar70.8%Aut.
MMMU70.2%Aut.
MMMU-Pro51.1%Aut.

Grounding

ScreenSpot87.1%Aut.
ScreenSpot Pro43.6%Aut.

Image To Text

DocVQA96.4%Aut.
OCRBench88.5%Aut.
OCRBench-V2 (en)61.5%Aut.

Long Context

EgoSchema76.2%Aut.
LVBench47.3%Aut.

Math

MathVista-Mini74.8%Aut.
MathVision38.1%Aut.

Multimodal

Android Control Low_EM93.7%Aut.
ChartQA89.5%Aut.
AI2D88.4%Aut.
MMBench88.0%Aut.
CC-OCR79.8%Aut.
TempCompass74.8%Aut.
VideoMME w/o sub.73.3%Aut.
PerceptionTest73.2%Aut.
MVBench70.4%Aut.
Android Control High_EM67.4%Aut.
MMBench-Video2.0%Aut.

Reasoning

Hallusion Bench55.2%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Image To Text
80
Structured Output
80
Text-to-image
80
Reasoning
70
Spatial Reasoning
70
Grounding
70
Healthcare
70
Long Context
60
Math
60
Multimodal
60
Vision
60
General
50
Video
50
Agents
40

Tarification

Prix d'entrée$2.8 / 1M tokens
Prix de sortie$8.4 / 1M tokens
Prix mixte (3:1)$4.2 / 1M tokens

Vitesse

Aucune donnée de vitesse disponible

Classement des Prix par Fournisseur

Classement des Prix par Fournisseur

12 fournisseurs

Moins cher: Nebius Token FactoryPlus cher: LLM Gateway
FournisseurEntréeSortie
1Nebius Token FactoryMoins cher
$0.25
$0.75
2SiliconFlow (China)
$0.59
$0.59
3SiliconFlow
$0.59
$0.59
4NanoGPT
$0.69989
$0.69989
5OpenRouter
$0.8
$1
6NovitaAI
$0.8
$0.8
7Kilo Gateway
$0.8
$0.8
8OVHcloud AI Endpoints
$1.01
$1.01
9Alibaba (China)
$2.294
$6.881
10Alibaba Cloud / Qwen TeamPRINCIPAL
$2.8
$8.4
11Alibaba
$2.8
$8.4
12LLM Gateway
$2.8
$8.4

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes