Перейти к основному содержанию

Qwen2.5 VL 72B Instruct

Alibaba Cloud / Qwen TeamQwenOpen Weighttongyi-qianwen

Описание

Qwen2.5-VL is the new flagship vision-language model of Qwen, significantly improved from Qwen2-VL. It excels at recognizing objects, analyzing text/charts/layouts in images, acting as a visual agent, understanding long videos (over 1 hour) with event pinpointing, performing visual localization (bounding boxes/points), and generating structured outputs from documents.

Дата выхода
2025-01-26
Параметры
72.0B
Длина контекста
32K
Модальности
image, text

Радар способностей

50
general
0
coding
60
reasoning
60
scienceоцен.
40
agents
80
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Agents & Tools82
45.0
LS
Multimodal Ranking54
73.0
LS
Reasoning74
55.0
LS

Оценки бенчмарков (LLM Stats)

Agents

AITZ_EM83.2%Сам.
MobileMiniWob++_SR68.0%Сам.
AndroidWorld_SR35.0%Сам.
OSWorld8.8%Сам.

General

MMVet76.2%Сам.
MLVU-M74.6%Сам.
MMStar70.8%Сам.
MMMU70.2%Сам.
MMMU-Pro51.1%Сам.

Grounding

ScreenSpot87.1%Сам.
ScreenSpot Pro43.6%Сам.

Image To Text

DocVQA96.4%Сам.
OCRBench88.5%Сам.
OCRBench-V2 (en)61.5%Сам.

Long Context

EgoSchema76.2%Сам.
LVBench47.3%Сам.

Math

MathVista-Mini74.8%Сам.
MathVision38.1%Сам.

Multimodal

Android Control Low_EM93.7%Сам.
ChartQA89.5%Сам.
AI2D88.4%Сам.
MMBench88.0%Сам.
CC-OCR79.8%Сам.
TempCompass74.8%Сам.
VideoMME w/o sub.73.3%Сам.
PerceptionTest73.2%Сам.
MVBench70.4%Сам.
Android Control High_EM67.4%Сам.
MMBench-Video2.0%Сам.

Reasoning

Hallusion Bench55.2%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Structured Output
80
Text-to-image
80
Image To Text
80
Spatial Reasoning
70
Grounding
70
Healthcare
70
Reasoning
70
Vision
60
Long Context
60
Math
60
Multimodal
60
Video
50
General
50
Agents
40

Цены

Цена ввода$0.25 / 1M tokens
Цена вывода$0.75 / 1M tokens
Смешанная цена (3:1)$0.375 / 1M tokens

Скорость

Нет данных о скорости

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки