Qwen3.6 27B (Reasoning)

AlibabaQwenОткрытые весаApache 2.0 · Коммерческое использование

Описание

Qwen3.6-27B is a dense 27-billion-parameter multimodal model in the Qwen3.6 series, supporting both vision-language thinking and non-thinking modes in a single unified checkpoint. The 64-layer language model uses a hybrid layout of 16 repeats of (3 × Gated DeltaNet → FFN, 1 × Gated Attention → FFN) with hidden dim 5120 and FFN intermediate 17408 — Gated DeltaNet has 48/16 heads for V/QK (head dim 128) and Gated Attention has 24/4 heads for Q/KV (head dim 256). It supports a native 262,144-token context extensible to ~1,010,000 via YaRN and is trained with multi-token prediction. The release delivers flagship-level agentic coding, surpassing the previous-generation open-source flagship Qwen3.5-397B-A17B (397B total / 17B active) on every major coding benchmark including SWE-bench Verified (77.2), SWE-bench Pro (53.5), Terminal-Bench 2.0 (59.3), and SkillsBench (48.2), and reaches 87.8 on GPQA Diamond. Released as open weights under Apache 2.0; accessible via Qwen Studio with the Alibaba Cloud Model Studio API coming soon.

Дата выхода

2026-04-22

Параметры

27.8B

Длина контекста

262K

Модальности

audio, image, text, video

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Агентные возможности	65	54.0	LS
Рейтинг кодинга	69	72.0	AA
Общий рейтинг	55	74.0	AA
Мультимодальный рейтинг	18	86.0	LS
Рассуждения	32	81.0	LS
Наука	79	64.0	AA

Оценки бенчмарков (LLM Stats)

Agents

QwenWebBench

1487.00 / 2000Сам.

GDPval-AA

1158.00 / 3000Сам.

AndroidWorld

70.3%Сам.

Claw-Eval

60.6%Сам.

Terminal-Bench 2.0

59.3%Сам.

SWE-Bench Pro

53.5%Сам.

ZClawBench

53.4%Сам.

SkillsBench

48.2%Сам.

NL2Repo

36.2%Сам.

Biology

GPQA

87.8%Сам.

Chemistry

SuperGPQA

66.0%Сам.

Code

SWE-Bench Verified

77.2%Сам.

SWE-bench Multilingual

71.3%Сам.

Embodied

EmbSpatialBench

0.85 / 100Сам.

Finance

MMLU-Pro

86.2%Сам.

General

MMLU-Redux

93.5%Сам.

C-Eval

91.4%Сам.

LiveCodeBench v6

83.9%Сам.

MMMU

82.9%Сам.

MMStar

81.4%Сам.

MMMU-Pro

75.8%Сам.

SimpleVQA

0.56 / 100Сам.

Grounding

RefCOCO-avg

0.93 / 100Сам.

RefSpatialBench

0.70 / 100Сам.

Healthcare

VideoMMMU

84.4%Сам.

Image To Text

OCRBench

89.4%Сам.

Long Context

MLVU

86.6%Сам.

Math

AIME 2026

94.1%Сам.

HMMT 2025

93.8%Сам.

HMMT25

90.7%Сам.

MathVista-Mini

87.4%Сам.

DynaMath

85.6%Сам.

HMMT Feb 26

84.3%Сам.

IMO-AnswerBench

80.8%Сам.

Humanity's Last Exam

24.0%Сам.

Multimodal

VLMsAreBlind

97.0%Сам.

94.7%Сам.

MMBench-V1.1

92.3%Сам.

VideoMME w sub.

87.7%Сам.

CC-OCR

81.2%Сам.

CharXiv-R

78.4%Сам.

MVBench

75.5%Сам.

Reasoning

CountBench

0.98 / 100Сам.

ERQA

62.5%Сам.

Spatial Reasoning

RealWorldQA

84.1%Сам.

Индексы оценки AA

Coding Index

53.7

Intelligence Index

37.1

Tau2

0.9

Gpqa

0.8

Lcr

0.7

Ifbench

0.7

Terminalbench V2 1

0.6

Scicode

0.4

Terminalbench Hard

0.3

Hle

0.2

Tau Banking

0.2

Оценки категорий LLM Stats

Legal

100

Finance

100

Agents

100

General

100

Reasoning

Language

Long Context

Biology

Math

Multimodal

Physics

Spatial Reasoning

Structured Output

Embodied

Frontend Development

Grounding

Healthcare

Chemistry

Text-to-image

Video

Vision

Image To Text

Code

Economics

Tool Calling

Coding

Цены

Цена ввода$0.6 / 1M токенов

Цена вывода$3.6 / 1M токенов

Смешанная цена (3:1)$1.35 / 1M токенов

Скорость

Токенов/сек65.4

Задержка первого токена1.33s

Время до первого ответа88.14s

Рейтинг цен провайдеров

9 провайдеров

Самый дешевый: NovitaСамый дорогой: routing.run

ПровайдерВводВывод

1NovitaСамый дешевый

2Chutes

$0.195

$1.56

3NanoGPT

$0.203

$2.24

4OpenRouter

$0.2885

$3.17

5Kilo Gateway

$0.325

$3.25

6Venice AI

$0.325

$3.25

7AlibabaОсновной

$0.6

$3.6

8Vercel AI Gateway

$0.6

$3.6

9routing.run

$1.1

$3.3

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis