Qwen3.6 Plus
AlibabaQwenProprietary
説明
Qwen3.6 Plus is Alibaba's next-generation flagship model featuring a 1 million token native context window, up to 65,536 output tokens, and always-on chain-of-thought reasoning. It uses a next-generation hybrid architecture optimized for efficiency and scalability. It leads on Terminal-Bench 2.0 agentic coding (61.6), surpassing Claude 4.5 Opus, and achieves strong results on document understanding (OmniDocBench 91.2) and multimodal reasoning (MMMU 86.0). Compared to Qwen 3.5, it is significantly more decisive in reasoning, using fewer tokens on straightforward tasks with better agent stability.
リリース日
2026-04-02
パラメータ
—
コンテキスト長
1.0M
モダリティ
image, text, video
能力レーダー
45
general
43
coding
88
reasoning
59
science推定
60
agents
90
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 44 | 58.0 | LS |
| Code Ranking | 31 | 78.0 | AA |
| General Ranking | 15 | 88.0 | AA |
| Multimodal Ranking | 14 | 87.0 | LS |
| Reasoning | 28 | 82.0 | LS |
| Science | 47 | 73.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
WideSearch
74.3%自己申告
MCP Atlas
74.1%自己申告
TAU3-Bench
70.7%自己申告
OSWorld-Verified
62.5%自己申告
TIR-Bench
61.6%自己申告
Terminal-Bench 2.0
61.6%自己申告
Claw-Eval
58.7%自己申告
SWE-Bench Pro
56.6%自己申告
MCP-Mark
48.2%自己申告
SkillsBench
45.7%自己申告
VITA-Bench
44.3%自己申告
DeepPlanning
41.5%自己申告
Toolathlon
39.8%自己申告
NL2Repo
37.9%自己申告
Biology
GPQA
90.4%自己申告
Chemistry
SuperGPQA
71.6%自己申告
Code
SWE-Bench Verified
78.8%自己申告
SWE-bench Multilingual
73.8%自己申告
Finance
MMLU-Pro
88.5%自己申告
MMLU-ProX
84.7%自己申告
General
MMLU-Redux
94.5%自己申告
IFEval
94.3%自己申告
C-Eval
93.3%自己申告
Global PIQA
89.8%自己申告
MMMLU
89.5%自己申告
MAXIFE
88.2%自己申告
LiveCodeBench v6
87.1%自己申告
MMMU
86.0%自己申告
Include
85.1%自己申告
MMStar
83.3%自己申告
MMMU-Pro
78.8%自己申告
IFBench
74.2%自己申告
SimpleVQA
0.67 / 100自己申告
LongBench v2
62.0%自己申告
NOVA-63
57.9%自己申告
Grounding
RefCOCO-avg
0.94 / 100自己申告
ScreenSpot Pro
68.2%自己申告
Healthcare
VideoMMMU
84.0%自己申告
Language
WMT24++
84.3%自己申告
Long Context
MLVU
86.7%自己申告
AA-LCR
68.3%自己申告
MMLongBench-Doc
0.62 / 100自己申告
Math
HMMT 2025
96.7%自己申告
AIME 2026
95.3%自己申告
HMMT25
94.6%自己申告
We-Math
89.0%自己申告
DynaMath
88.0%自己申告
MathVision
88.0%自己申告
HMMT Feb 26
87.8%自己申告
IMO-AnswerBench
83.8%自己申告
PolyMATH
77.4%自己申告
Humanity's Last Exam
28.8%自己申告
Multimodal
V*
96.9%自己申告
AI2D
94.4%自己申告
OmniDocBench 1.5
91.2%自己申告
Video-MME
84.2%自己申告
CC-OCR
83.4%自己申告
CharXiv-R
81.5%自己申告
Reasoning
CountBench
0.98 / 100自己申告
ERQA
65.7%自己申告
Spatial Reasoning
RealWorldQA
85.4%自己申告
Vision
ODinW
51.8%自己申告
AA評価指数
Intelligence Index50.0
Coding Index42.9
Tau21.0
Gpqa0.9
Ifbench0.8
Lcr0.7
Terminalbench Hard0.4
Scicode0.4
Hle0.3
LLM Statsカテゴリスコア
Video90
Biology90
Language90
Spatial Reasoning80
Structured Output80
Text-to-image80
Vision80
Chemistry80
Finance80
Frontend Development80
General80
Grounding80
Healthcare80
Instruction Following80
Legal80
Math80
Multimodal80
Physics80
Reasoning80
Code70
Economics70
Image To Text70
Long Context70
Search70
Tool Calling60
Agents60
Coding50
価格設定
入力価格$0.5 / 1M tokens
出力価格$3 / 1M tokens
混合価格(3:1)$1.125 / 1M tokens
速度
トークン/秒52.7 tokens/s
初トークン遅延1.69s
初回答遅延107.01s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| Together | 500K | 3.0M |