Qwen3 VL 30B A3B Instruct

AlibabaQwenОткрытые весаApache 2.0 · Коммерческое использование

Описание

Qwen3-VL is a large multimodal model that unifies vision, language, and reasoning to achieve human-level perception and cognition across text, images, and video. Built on a 235B-parameter architecture, it integrates early joint training of visual and textual modalities for strong language grounding. The model supports up to a 1 million-token context window and excels at visual understanding, spatial reasoning, long video comprehension, and tool-based interaction. It can generate code from images, perform precise 2D/3D object grounding, and operate digital interfaces like a visual agent. The “Instruct” version rivals Gemini 2.5 Pro in perception benchmarks, while the “Thinking” version leads in multimodal reasoning and STEM tasks. With multilingual OCR, creative writing, and fine-grained scene interpretation, Qwen3-VL establishes a new open-source frontier for integrated vision-language intelligence.

Дата выхода

2025-10-03

Параметры

31.0B

Длина контекста

131K

Модальности

image, text, video

Радар способностей

general

coding

reasoning

scienceоцен.

agents

100

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Агентные возможности	80	52.0	LS
Рейтинг кодинга	289	31.0	AA
Общий рейтинг	341	33.0	AA
Математическое мышление	110	73.0	AA
Мультимодальный рейтинг	50	75.0	LS
Рассуждения	90	51.0	LS
Наука	255	44.0	AA

Оценки бенчмарков (LLM Stats)

3d

BLINK

67.7%Сам.

Agents

BFCL-v3

66.3%Сам.

OSWorld

30.3%Сам.

Biology

GPQA

70.4%Сам.

Chemistry

SuperGPQA

53.1%Сам.

Communication

MM-MT-Bench

8.10 / 100Сам.

WritingBench

82.6%Сам.

Multi-IF

66.1%Сам.

Creativity

Creative Writing v3

84.6%Сам.

Arena-Hard v2

58.5%Сам.

Factuality

SimpleQA

27.0%Сам.

Finance

MMLU

85.0%Сам.

MMLU-Pro

77.8%Сам.

MMLU-ProX

70.9%Сам.

General

MMLU-Redux

88.4%Сам.

IFEval

85.8%Сам.

MLVU-M

81.3%Сам.

MMMU (val)

74.2%Сам.

MMStar

72.1%Сам.

Include

71.6%Сам.

LiveBench 20241125

65.4%Сам.

MMMU-Pro

60.4%Сам.

LiveCodeBench v6

42.6%Сам.

Grounding

ScreenSpot

94.7%Сам.

ScreenSpot Pro

60.5%Сам.

Healthcare

VideoMMMU

68.7%Сам.

Image To Text

OCRBench

90.3%Сам.

OCRBench-V2 (en)

63.2%Сам.

OCRBench-V2 (zh)

57.8%Сам.

Language

CharadesSTA

63.5%Сам.

Long Context

LVBench

62.5%Сам.

Math

MathVista-Mini

80.1%Сам.

AIME 2025

69.3%Сам.

MathVision

60.2%Сам.

HMMT25

50.6%Сам.

PolyMATH

44.3%Сам.

Multimodal

DocVQAtest

95.0%Сам.

MMBench-V1.1

87.0%Сам.

CharXiv-D

85.5%Сам.

AI2D

85.0%Сам.

InfoVQAtest

82.0%Сам.

CC-OCR

80.7%Сам.

Video-MME

74.5%Сам.

MVBench

72.3%Сам.

MuirBench

62.9%Сам.

CharXiv-R

48.9%Сам.

Reasoning

Hallusion Bench

61.5%Сам.

ERQA

43.0%Сам.

Spatial Reasoning

RealWorldQA

73.7%Сам.

Vision

ODinW

47.5%Сам.

Индексы оценки AA

Math Index

72.3

Intelligence Index

10.0

Mmlu Pro

0.8

Aime 25

0.7

Gpqa

0.7

Livecodebench

0.5

Ifbench

0.3

Scicode

0.3

Lcr

0.2

Tau2

0.2

Hle

0.1

Terminalbench Hard

0.1

Оценки категорий LLM Stats

Communication

Multimodal

100

Instruction Following

Language

Structured Output

Grounding

Creativity

Text-to-image

Writing

Image To Text

Legal

Math

Reasoning

Spatial Reasoning

Finance

General

Healthcare

Biology

Tool Calling

Video

Vision

Long Context

Physics

Chemistry

Agents

Economics

Factuality

Цены

Цена ввода$0.2 / 1M токенов

Цена вывода$0.6 / 1M токенов

Смешанная цена (3:1)$0.3 / 1M токенов

Скорость

Токенов/сек122.4

Задержка первого токена1.11s

Время до первого ответа1.11s

Рейтинг цен провайдеров

9 провайдеров

Самый дешевый: OpenRouterСамый дорогой: SiliconFlow

ПровайдерВводВывод

1OpenRouterСамый дешевый

$0.13

$1.56

2Kilo Gateway

$0.13

$1.56

3NEAR AI Cloud

$0.15

$0.55

4AlibabaОсновной

$0.2

$0.6

5NovitaAI

$0.2

6LLM Gateway

$0.2

7evroc

$0.24

$0.94

8SiliconFlow (China)

$0.29

9SiliconFlow

$0.29

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis