メインコンテンツへスキップ

Qwen2.5 VL 32B Instruct

Alibaba Cloud / Qwen TeamQwenオープンウエイトApache 2.0 · 商用利用可

説明

Qwen2.5-VL is a vision-language model from the Qwen family. Key enhancements include visual understanding (objects, text, charts, layouts), visual agent capabilities (tool use, computer/phone control), long video comprehension with event pinpointing, visual localization (bounding boxes/points), and structured output generation.

リリース日
2025-02-28
パラメータ
33.5B
コンテキスト長
モダリティ

能力レーダー

50
general
90
coding
70
reasoning
43
science推定
40
agents
70
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
エージェント能力115
33.0
LS
マルチモーダルランキング74
66.0
LS

ベンチマークスコア (LLM Stats)

Agents

AITZ_EM83.1%自己申告
AndroidWorld_SR22.0%自己申告
OSWorld5.9%自己申告

Biology

GPQA46.0%自己申告

Code

HumanEval91.5%自己申告

Finance

MMLU78.4%自己申告
MMLU-Pro68.8%自己申告

General

MBPP0.84 / 100自己申告
MMMU70.0%自己申告
MMStar69.5%自己申告
MMMU-Pro49.5%自己申告

Grounding

ScreenSpot88.5%自己申告
ScreenSpot Pro39.4%自己申告

Image To Text

DocVQA94.8%自己申告
OCRBench-V2 (zh)59.1%自己申告
OCRBench-V2 (en)57.2%自己申告

Language

CharadesSTA54.2%自己申告

Long Context

LVBench49.0%自己申告

Math

MATH82.2%自己申告
MathVista-Mini74.7%自己申告
MathVision38.4%自己申告

Multimodal

Android Control Low_EM93.3%自己申告
InfoVQA83.4%自己申告
VideoMME w sub.77.9%自己申告
CC-OCR77.1%自己申告
VideoMME w/o sub.70.5%自己申告
Android Control High_EM69.6%自己申告
MMBench-Video1.9%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Code
90
Structured Output
80
Text-to-image
80
Image To Text
70
Language
70
Legal
70
Math
70
Finance
70
Healthcare
70
Multimodal
60
Reasoning
60
Spatial Reasoning
60
Grounding
60
Vision
60
Long Context
50
Physics
50
General
50
Biology
50
Chemistry
50
Video
50
Agents
40

価格設定

価格データがありません

速度

速度データがありません

プロバイダー価格ランキング

プロバイダー価格ランキング

6 プロバイダー

最安: IO.NET最高: LLM Gateway
プロバイダー入力出力
1IO.NET最安
$0.05
$0.22
2Chutes
$0.0543
$0.2174
3Meganova
$0.2
$0.6
4SiliconFlow (China)
$0.27
$0.27
5SiliconFlow
$0.27
$0.27
6LLM Gateway
$1.4
$4.2

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク