Qwen2.5 VL 32B Instruct

Alibaba Cloud / Qwen TeamQwenОткрытые весаApache 2.0 · Коммерческое использование

Описание

Qwen2.5-VL is a vision-language model from the Qwen family. Key enhancements include visual understanding (objects, text, charts, layouts), visual agent capabilities (tool use, computer/phone control), long video comprehension with event pinpointing, visual localization (bounding boxes/points), and structured output generation.

Дата выхода

2025-02-28

Параметры

33.5B

Длина контекста

—

Модальности

—

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Агентные возможности	115	33.0	LS
Мультимодальный рейтинг	74	66.0	LS

Оценки бенчмарков (LLM Stats)

Agents

AITZ_EM

83.1%Сам.

AndroidWorld_SR

22.0%Сам.

OSWorld

5.9%Сам.

Biology

GPQA

46.0%Сам.

Code

HumanEval

91.5%Сам.

Finance

MMLU

78.4%Сам.

MMLU-Pro

68.8%Сам.

General

MBPP

0.84 / 100Сам.

MMMU

70.0%Сам.

MMStar

69.5%Сам.

MMMU-Pro

49.5%Сам.

Grounding

ScreenSpot

88.5%Сам.

ScreenSpot Pro

39.4%Сам.

Image To Text

DocVQA

94.8%Сам.

OCRBench-V2 (zh)

59.1%Сам.

OCRBench-V2 (en)

57.2%Сам.

Language

CharadesSTA

54.2%Сам.

Long Context

LVBench

49.0%Сам.

Math

MATH

82.2%Сам.

MathVista-Mini

74.7%Сам.

MathVision

38.4%Сам.

Multimodal

Android Control Low_EM

93.3%Сам.

InfoVQA

83.4%Сам.

VideoMME w sub.

77.9%Сам.

CC-OCR

77.1%Сам.

VideoMME w/o sub.

70.5%Сам.

Android Control High_EM

69.6%Сам.

MMBench-Video

1.9%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Code

Structured Output

Text-to-image

Image To Text

Language

Legal

Math

Finance

Healthcare

Multimodal

Reasoning

Spatial Reasoning

Grounding

Vision

Long Context

Physics

General

Biology

Chemistry

Video

Agents

Цены

Нет данных о ценах

Скорость

Нет данных о скорости

Рейтинг цен провайдеров

6 провайдеров

Самый дешевый: IO.NETСамый дорогой: LLM Gateway

ПровайдерВводВывод

1IO.NETСамый дешевый

$0.05

$0.22

2Chutes

$0.0543

$0.2174

3Meganova

$0.2

$0.6

4SiliconFlow (China)

$0.27

5SiliconFlow

$0.27

6LLM Gateway

$1.4

$4.2

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis