Saltar al contenido principal

Qwen2.5 VL 32B Instruct

Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Uso Comercial

Descripción

Qwen2.5-VL is a vision-language model from the Qwen family. Key enhancements include visual understanding (objects, text, charts, layouts), visual agent capabilities (tool use, computer/phone control), long video comprehension with event pinpointing, visual localization (bounding boxes/points), and structured output generation.

Fecha de lanzamiento
2025-02-28
Parámetros
33.5B
Longitud del contexto
Modalidades

Radar de capacidades

50
general
90
coding
70
reasoning
43
scienceest.
40
agents
70
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Capacidad agéntica115
33.0
LS
Ranking multimodal74
66.0
LS

Puntuaciones de benchmarks (LLM Stats)

Agents

AITZ_EM83.1%Aut.
AndroidWorld_SR22.0%Aut.
OSWorld5.9%Aut.

Biology

GPQA46.0%Aut.

Code

HumanEval91.5%Aut.

Finance

MMLU78.4%Aut.
MMLU-Pro68.8%Aut.

General

MBPP0.84 / 100Aut.
MMMU70.0%Aut.
MMStar69.5%Aut.
MMMU-Pro49.5%Aut.

Grounding

ScreenSpot88.5%Aut.
ScreenSpot Pro39.4%Aut.

Image To Text

DocVQA94.8%Aut.
OCRBench-V2 (zh)59.1%Aut.
OCRBench-V2 (en)57.2%Aut.

Language

CharadesSTA54.2%Aut.

Long Context

LVBench49.0%Aut.

Math

MATH82.2%Aut.
MathVista-Mini74.7%Aut.
MathVision38.4%Aut.

Multimodal

Android Control Low_EM93.3%Aut.
InfoVQA83.4%Aut.
VideoMME w sub.77.9%Aut.
CC-OCR77.1%Aut.
VideoMME w/o sub.70.5%Aut.
Android Control High_EM69.6%Aut.
MMBench-Video1.9%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

Code
90
Structured Output
80
Text-to-image
80
Image To Text
70
Language
70
Legal
70
Math
70
Finance
70
Healthcare
70
Multimodal
60
Reasoning
60
Spatial Reasoning
60
Grounding
60
Vision
60
Long Context
50
Physics
50
General
50
Biology
50
Chemistry
50
Video
50
Agents
40

Precios

No hay datos de precios disponibles

Velocidad

No hay datos de velocidad disponibles

Ranking de Precios por Proveedor

Ranking de Precios por Proveedor

6 proveedores

Más barato: IO.NETMás caro: LLM Gateway
ProveedorEntradaSalida
1IO.NETMás barato
$0.05
$0.22
2Chutes
$0.0543
$0.2174
3Meganova
$0.2
$0.6
4SiliconFlow (China)
$0.27
$0.27
5SiliconFlow
$0.27
$0.27
6LLM Gateway
$1.4
$4.2

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas