メインコンテンツへスキップ

Qwen3.6 27B (Reasoning)

AlibabaQwenオープンウエイトApache 2.0 · 商用利用可

説明

Qwen3.6-27B is a dense 27-billion-parameter multimodal model in the Qwen3.6 series, supporting both vision-language thinking and non-thinking modes in a single unified checkpoint. The 64-layer language model uses a hybrid layout of 16 repeats of (3 × Gated DeltaNet → FFN, 1 × Gated Attention → FFN) with hidden dim 5120 and FFN intermediate 17408 — Gated DeltaNet has 48/16 heads for V/QK (head dim 128) and Gated Attention has 24/4 heads for Q/KV (head dim 256). It supports a native 262,144-token context extensible to ~1,010,000 via YaRN and is trained with multi-token prediction. The release delivers flagship-level agentic coding, surpassing the previous-generation open-source flagship Qwen3.5-397B-A17B (397B total / 17B active) on every major coding benchmark including SWE-bench Verified (77.2), SWE-bench Pro (53.5), Terminal-Bench 2.0 (59.3), and SkillsBench (48.2), and reaches 87.8 on GPQA Diamond. Released as open weights under Apache 2.0; accessible via Qwen Studio with the Alibaba Cloud Model Studio API coming soon.

リリース日
2026-04-22
パラメータ
27.8B
コンテキスト長
262K
モダリティ
audio, image, text, video

能力レーダー

34
general
52
coding
84
reasoning
56
science推定
60
agents
80
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
エージェント能力65
54.0
LS
コーディングランキング69
72.0
AA
総合ランキング55
74.0
AA
マルチモーダルランキング18
86.0
LS
推論32
81.0
LS
科学79
64.0
AA

ベンチマークスコア (LLM Stats)

Agents

QwenWebBench1487.00 / 2000自己申告
GDPval-AA1158.00 / 3000自己申告
AndroidWorld70.3%自己申告
Claw-Eval60.6%自己申告
Terminal-Bench 2.059.3%自己申告
SWE-Bench Pro53.5%自己申告
ZClawBench53.4%自己申告
SkillsBench48.2%自己申告
NL2Repo36.2%自己申告

Biology

GPQA87.8%自己申告

Chemistry

SuperGPQA66.0%自己申告

Code

SWE-Bench Verified77.2%自己申告
SWE-bench Multilingual71.3%自己申告

Embodied

EmbSpatialBench0.85 / 100自己申告

Finance

MMLU-Pro86.2%自己申告

General

MMLU-Redux93.5%自己申告
C-Eval91.4%自己申告
LiveCodeBench v683.9%自己申告
MMMU82.9%自己申告
MMStar81.4%自己申告
MMMU-Pro75.8%自己申告
SimpleVQA0.56 / 100自己申告

Grounding

RefCOCO-avg0.93 / 100自己申告
RefSpatialBench0.70 / 100自己申告

Healthcare

VideoMMMU84.4%自己申告

Image To Text

OCRBench89.4%自己申告

Long Context

MLVU86.6%自己申告

Math

AIME 202694.1%自己申告
HMMT 202593.8%自己申告
HMMT2590.7%自己申告
MathVista-Mini87.4%自己申告
DynaMath85.6%自己申告
HMMT Feb 2684.3%自己申告
IMO-AnswerBench80.8%自己申告
Humanity's Last Exam24.0%自己申告

Multimodal

VLMsAreBlind97.0%自己申告
V*94.7%自己申告
MMBench-V1.192.3%自己申告
VideoMME w sub.87.7%自己申告
CC-OCR81.2%自己申告
CharXiv-R78.4%自己申告
MVBench75.5%自己申告

Reasoning

CountBench0.98 / 100自己申告
ERQA62.5%自己申告

Spatial Reasoning

RealWorldQA84.1%自己申告

AA評価指数

Coding Index
53.7
Intelligence Index
37.1
Tau2
0.9
Gpqa
0.8
Lcr
0.7
Ifbench
0.7
Terminalbench V2 1
0.6
Scicode
0.4
Terminalbench Hard
0.3
Hle
0.2
Tau Banking
0.2

LLM Statsカテゴリスコア

Legal
100
Finance
100
Agents
100
General
100
Reasoning
44
Language
90
Long Context
90
Biology
90
Math
80
Multimodal
80
Physics
80
Spatial Reasoning
80
Structured Output
80
Embodied
80
Frontend Development
80
Grounding
80
Healthcare
80
Chemistry
80
Text-to-image
80
Video
80
Vision
80
Image To Text
70
Code
70
Economics
70
Tool Calling
60
Coding
50

価格設定

入力価格$0.6 / 1Mトークン
出力価格$3.6 / 1Mトークン
混合価格(3:1)$1.35 / 1Mトークン

速度

トークン/秒65.4
初トークン遅延1.33s
初回答遅延88.14s

プロバイダー価格ランキング

プロバイダー価格ランキング

9 プロバイダー

最安: Novita最高: routing.run
プロバイダー入力出力
1Novita最安
$0
$0
2Chutes
$0.195
$1.56
3NanoGPT
$0.203
$2.24
4OpenRouter
$0.2885
$3.17
5Kilo Gateway
$0.325
$3.25
6Venice AI
$0.325
$3.25
7Alibabaプライマリ
$0.6
$3.6
8Vercel AI Gateway
$0.6
$3.6
9routing.run
$1.1
$3.3

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク