Qwen3 VL 235B A22B (Reasoning)

AlibabaQwenओपन वेटApache 2.0 · व्यावसायिक उपयोग

विवरण

Qwen3-VL-235B-A22B-Thinking is the most powerful vision-language model in the Qwen series, featuring 236B parameters with MoE architecture for reasoning-enhanced multimodal understanding. Key capabilities include: Visual Agent (operates PC/mobile GUIs, recognizes elements, invokes tools), Visual Coding (generates Draw.io/HTML/CSS/JS from images/videos), Advanced Spatial Perception (2D grounding and 3D grounding for spatial reasoning and embodied AI), Long Context & Video Understanding (native 256K context expandable to 1M, handles hours-long video with second-level indexing), Enhanced Multimodal Reasoning (excels in STEM/Math with causal analysis), Upgraded Visual Recognition (celebrities, anime, products, landmarks, flora/fauna), and Expanded OCR (32 languages, robust in low light/blur/tilt). Architecture innovations include Interleaved-MRoPE for positional embeddings, DeepStack for multi-level ViT feature fusion, and Text-Timestamp Alignment for precise video temporal modeling.

रिलीज़ तिथि

2025-09-23

पैरामीटर

236.0B

संदर्भ लंबाई

131K

मोडैलिटीज़

image, text, video

क्षमता रडार

general

coding

reasoning

scienceअनुमानित

agents

100

multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन	#रैंक	स्कोर	स्रोत
एजेंटिक क्षमता	19	66.0	LS
कोडिंग रैंकिंग	158	55.0	AA
सामान्य रैंकिंग	165	55.0	AA
गणितीय तर्क	49	89.0	AA
मल्टीमॉडल रैंकिंग	73	67.0	LS
तर्क	40	75.0	LS
विज्ञान	155	54.0	AA

बेंचमार्क स्कोर (LLM Stats)

3d

Objectron

0.71 / 100स्वयं

BLINK

67.1%स्वयं

ARKitScenes

0.54 / 100स्वयं

SUNRGBD

0.35 / 100स्वयं

Hypersim

0.11 / 100स्वयं

Agents

SIFO

0.77 / 100स्वयं

BFCL-v3

71.9%स्वयं

SIFO-Multiturn

0.71 / 100स्वयं

OSWorld-G

0.68 / 100स्वयं

OSWorld

38.1%स्वयं

Chemistry

SuperGPQA

64.3%स्वयं

Code

Design2Code

0.93 / 100स्वयं

Communication

MM-MT-Bench

8.50 / 100स्वयं

WritingBench

86.7%स्वयं

Multi-IF

79.1%स्वयं

Creativity

Creative Writing v3

85.7%स्वयं

Embodied

EmbSpatialBench

0.84 / 100स्वयं

RoboSpatialHome

0.74 / 100स्वयं

Factuality

SimpleQA

44.4%स्वयं

Finance

MMLU

90.6%स्वयं

MMLU-Pro

83.8%स्वयं

MMLU-ProX

80.6%स्वयं

General

MMLU-Redux

93.7%स्वयं

IFEval

88.2%स्वयं

MMMUval

80.6%स्वयं

Include

80.0%स्वयं

LiveBench 20241125

79.6%स्वयं

MMStar

78.7%स्वयं

LiveCodeBench v6

70.1%स्वयं

MMMU-Pro

69.3%स्वयं

SimpleVQA

0.61 / 100स्वयं

Grounding

ScreenSpot

95.4%स्वयं

RefCOCO-avg

0.92 / 100स्वयं

RefSpatialBench

0.70 / 100स्वयं

ScreenSpot Pro

61.8%स्वयं

Healthcare

VideoMMMU

80.0%स्वयं

Image To Text

OCRBench

87.5%स्वयं

OCRBench-V2 (en)

66.8%स्वयं

OCRBench-V2 (zh)

63.5%स्वयं

Instruction Following

MIABench

0.93 / 100स्वयं

Language

CharadesSTA

63.5%स्वयं

Long Context

MLVU

83.8%स्वयं

LVBench

63.6%स्वयं

MMLongBench-Doc

0.56 / 100स्वयं

Math

AIME 2025

89.7%स्वयं

MathVista-Mini

85.8%स्वयं

MathVerse-Mini

0.85 / 100स्वयं

HMMT25

77.4%स्वयं

MathVision

74.6%स्वयं

Humanity's Last Exam

13.6%स्वयं

Multimodal

DocVQAtest

96.5%स्वयं

MMBench-V1.1

90.6%स्वयं

InfoVQAtest

89.5%स्वयं

AI2D

89.2%स्वयं

CC-OCR

81.5%स्वयं

MuirBench

80.1%स्वयं

VideoMME w/o sub.

79.0%स्वयं

CharXiv-R

66.1%स्वयं

VisuLogic

0.34 / 100स्वयं

ZEROBench-Sub

0.28 / 100स्वयं

ZEROBench

0.04 / 100स्वयं

Reasoning

ZebraLogic

97.3%स्वयं

CountBench

0.94 / 100स्वयं

Hallusion Bench

66.7%स्वयं

ERQA

52.5%स्वयं

Spatial Reasoning

RealWorldQA

81.3%स्वयं

Vision

ODinW

43.2%स्वयं

AA मूल्यांकन सूचकांक

Math Index

88.3

Intelligence Index

20.6

Aime 25

0.9

Mmlu Pro

0.8

Gpqa

0.8

Livecodebench

0.6

Lcr

0.6

Ifbench

0.6

Tau2

0.5

Scicode

0.4

Terminalbench Hard

0.1

Hle

0.1

LLM Stats श्रेणी स्कोर

Communication

Multimodal

100

Creativity

Writing

Instruction Following

Language

Legal

Math

Structured Output

Embodied

Finance

Grounding

Healthcare

Text-to-image

Video

Image To Text

Long Context

Reasoning

Spatial Reasoning

General

Tool Calling

Vision

Physics

Agents

Chemistry

Economics

Factuality

मूल्य निर्धारण

इनपुट मूल्य$0.84 / 1M टोकन

आउटपुट मूल्य$6.175 / 1M टोकन

मिश्रित मूल्य (3:1)$2.174 / 1M टोकन

गति

टोकन/सेकंड57.2

पहले टोकन में देरी1.16s

पहले उत्तर में देरी36.11s

प्रदाता मूल्य रैंकिंग

10 प्रदाता

सबसे सस्ता: Venice AIसबसे महंगा: NovitaAI

प्रदाताइनपुटआउटपुट

1Venice AIसबसे सस्ता

$0.25

$1.5

2OpenRouter

$0.26

$2.6

3Kilo Gateway

$0.26

$2.6

4Alibaba (China)

$0.28671

$1.14682

5SiliconFlow (China)

$0.45

$3.5

6SiliconFlow

$0.45

$3.5

7NanoGPT

$0.5

8LLM Gateway

$0.5

9Alibaba

$0.7

$2.8

10NovitaAI

$0.98

$3.95

इस मॉडल के लिए विभिन्न API प्रदाताओं के मूल्य निर्धारण की तुलना करें।

बाहरी लिंक

LLM Stats Artificial Analysis