メインコンテンツへスキップ

Qwen3.6 Plus

AlibabaQwenProprietary

説明

Qwen3.6 Plus is Alibaba's next-generation flagship model featuring a 1 million token native context window, up to 65,536 output tokens, and always-on chain-of-thought reasoning. It uses a next-generation hybrid architecture optimized for efficiency and scalability. It leads on Terminal-Bench 2.0 agentic coding (61.6), surpassing Claude 4.5 Opus, and achieves strong results on document understanding (OmniDocBench 91.2) and multimodal reasoning (MMMU 86.0). Compared to Qwen 3.5, it is significantly more decisive in reasoning, using fewer tokens on straightforward tasks with better agent stability.

リリース日
2026-04-02
パラメータ
コンテキスト長
1.0M
モダリティ
image, text, video

能力レーダー

45
general
43
coding
88
reasoning
59
science推定
60
agents
90
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools44
58.0
LS
Code Ranking31
78.0
AA
General Ranking15
88.0
AA
Multimodal Ranking14
87.0
LS
Reasoning28
82.0
LS
Science47
73.0
AA

ベンチマークスコア (LLM Stats)

Agents

WideSearch74.3%自己申告
MCP Atlas74.1%自己申告
TAU3-Bench70.7%自己申告
OSWorld-Verified62.5%自己申告
TIR-Bench61.6%自己申告
Terminal-Bench 2.061.6%自己申告
Claw-Eval58.7%自己申告
SWE-Bench Pro56.6%自己申告
MCP-Mark48.2%自己申告
SkillsBench45.7%自己申告
VITA-Bench44.3%自己申告
DeepPlanning41.5%自己申告
Toolathlon39.8%自己申告
NL2Repo37.9%自己申告

Biology

GPQA90.4%自己申告

Chemistry

SuperGPQA71.6%自己申告

Code

SWE-Bench Verified78.8%自己申告
SWE-bench Multilingual73.8%自己申告

Finance

MMLU-Pro88.5%自己申告
MMLU-ProX84.7%自己申告

General

MMLU-Redux94.5%自己申告
IFEval94.3%自己申告
C-Eval93.3%自己申告
Global PIQA89.8%自己申告
MMMLU89.5%自己申告
MAXIFE88.2%自己申告
LiveCodeBench v687.1%自己申告
MMMU86.0%自己申告
Include85.1%自己申告
MMStar83.3%自己申告
MMMU-Pro78.8%自己申告
IFBench74.2%自己申告
SimpleVQA0.67 / 100自己申告
LongBench v262.0%自己申告
NOVA-6357.9%自己申告

Grounding

RefCOCO-avg0.94 / 100自己申告
ScreenSpot Pro68.2%自己申告

Healthcare

VideoMMMU84.0%自己申告

Language

WMT24++84.3%自己申告

Long Context

MLVU86.7%自己申告
AA-LCR68.3%自己申告
MMLongBench-Doc0.62 / 100自己申告

Math

HMMT 202596.7%自己申告
AIME 202695.3%自己申告
HMMT2594.6%自己申告
We-Math89.0%自己申告
DynaMath88.0%自己申告
MathVision88.0%自己申告
HMMT Feb 2687.8%自己申告
IMO-AnswerBench83.8%自己申告
PolyMATH77.4%自己申告
Humanity's Last Exam28.8%自己申告

Multimodal

V*96.9%自己申告
AI2D94.4%自己申告
OmniDocBench 1.591.2%自己申告
Video-MME84.2%自己申告
CC-OCR83.4%自己申告
CharXiv-R81.5%自己申告

Reasoning

CountBench0.98 / 100自己申告
ERQA65.7%自己申告

Spatial Reasoning

RealWorldQA85.4%自己申告

Vision

ODinW51.8%自己申告

AA評価指数

Intelligence Index
50.0
Coding Index
42.9
Tau2
1.0
Gpqa
0.9
Ifbench
0.8
Lcr
0.7
Terminalbench Hard
0.4
Scicode
0.4
Hle
0.3

LLM Statsカテゴリスコア

Video
90
Biology
90
Language
90
Spatial Reasoning
80
Structured Output
80
Text-to-image
80
Vision
80
Chemistry
80
Finance
80
Frontend Development
80
General
80
Grounding
80
Healthcare
80
Instruction Following
80
Legal
80
Math
80
Multimodal
80
Physics
80
Reasoning
80
Code
70
Economics
70
Image To Text
70
Long Context
70
Search
70
Tool Calling
60
Agents
60
Coding
50

価格設定

入力価格$0.5 / 1M tokens
出力価格$3 / 1M tokens
混合価格(3:1)$1.125 / 1M tokens

速度

トークン/秒52.7 tokens/s
初トークン遅延1.69s
初回答遅延107.01s

利用可能なプロバイダー

(LS内部単位)
プロバイダー入力価格出力価格
Together500K3.0M

外部リンク