メインコンテンツへスキップ

Qwen3.6 Plus

AlibabaQwenProprietary

説明

Qwen3.6 Plus is Alibaba's next-generation flagship model featuring a 1 million token native context window, up to 65,536 output tokens, and always-on chain-of-thought reasoning. It uses a next-generation hybrid architecture optimized for efficiency and scalability. It leads on Terminal-Bench 2.0 agentic coding (61.6), surpassing Claude 4.5 Opus, and achieves strong results on document understanding (OmniDocBench 91.2) and multimodal reasoning (MMMU 86.0). Compared to Qwen 3.5, it is significantly more decisive in reasoning, using fewer tokens on straightforward tasks with better agent stability.

リリース日
2026-04-02
パラメータ
コンテキスト長
1.0M
モダリティ
image, text, video

能力レーダー

37
general
52
coding
88
reasoning
59
science推定
60
agents
90
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
エージェント能力68
54.0
LS
コーディングランキング52
76.0
AA
総合ランキング23
80.0
AA
マルチモーダルランキング17
87.0
LS
推論29
82.0
LS
科学62
69.0
AA

ベンチマークスコア (LLM Stats)

Agents

GDPval-AA1160.00 / 3000自己申告
WideSearch74.3%自己申告
MCP Atlas74.1%自己申告
TAU3-Bench70.7%自己申告
OSWorld-Verified62.5%自己申告
TIR-Bench61.6%自己申告
Terminal-Bench 2.061.6%自己申告
Claw-Eval58.7%自己申告
SWE-Bench Pro56.6%自己申告
MCP-Mark48.2%自己申告
SkillsBench45.7%自己申告
VITA-Bench44.3%自己申告
DeepPlanning41.5%自己申告
Finance Agent v240.8%自己申告
Toolathlon39.8%自己申告
NL2Repo37.9%自己申告
FrontierSWE22.0%自己申告

Biology

GPQA90.4%自己申告

Chemistry

SuperGPQA71.6%自己申告

Code

SWE-Bench Verified78.8%自己申告
SWE-bench Multilingual73.8%自己申告

Finance

MMLU-Pro88.5%自己申告
MMLU-ProX84.7%自己申告

General

MMLU-Redux94.5%自己申告
IFEval94.3%自己申告
C-Eval93.3%自己申告
Global PIQA89.8%自己申告
MMMLU89.5%自己申告
MAXIFE88.2%自己申告
LiveCodeBench v687.1%自己申告
MMMU86.0%自己申告
Include85.1%自己申告
MMStar83.3%自己申告
MMMU-Pro78.8%自己申告
IFBench74.2%自己申告
LiveBench70.9%自己申告
SimpleVQA0.67 / 100自己申告
LongBench v262.0%自己申告
NOVA-6357.9%自己申告

Grounding

RefCOCO-avg0.94 / 100自己申告
ScreenSpot Pro68.2%自己申告

Healthcare

VideoMMMU84.0%自己申告

Language

WMT24++84.3%自己申告

Long Context

MLVU86.7%自己申告
AA-LCR68.3%自己申告
MMLongBench-Doc0.62 / 100自己申告

Math

HMMT 202596.7%自己申告
AIME 202695.3%自己申告
HMMT2594.6%自己申告
We-Math89.0%自己申告
DynaMath88.0%自己申告
MathVision88.0%自己申告
HMMT Feb 2687.8%自己申告
IMO-AnswerBench83.8%自己申告
PolyMATH77.4%自己申告
Humanity's Last Exam28.8%自己申告

Multimodal

V*96.9%自己申告
AI2D94.4%自己申告
OmniDocBench 1.591.2%自己申告
Video-MME84.2%自己申告
CC-OCR83.4%自己申告
CharXiv-R81.5%自己申告

Reasoning

CountBench0.98 / 100自己申告
ERQA65.7%自己申告

Spatial Reasoning

RealWorldQA85.4%自己申告

Vision

ODinW51.8%自己申告

AA評価指数

Coding Index
54.5
Intelligence Index
39.6
Tau2
1.0
Gpqa
0.9
Ifbench
0.8
Lcr
0.7
Terminalbench V2 1
0.6
Terminalbench Hard
0.4
Scicode
0.4
Hle
0.3
Tau Banking
0.2

LLM Statsカテゴリスコア

Legal
100
Finance
100
Agents
69
General
54
Reasoning
28
Language
90
Biology
90
Video
90
Math
80
Multimodal
80
Physics
80
Spatial Reasoning
80
Structured Output
80
Instruction Following
80
Frontend Development
80
Grounding
80
Healthcare
80
Chemistry
80
Text-to-image
80
Vision
80
Search
70
Image To Text
70
Long Context
70
Economics
70
Code
60
Tool Calling
60
Coding
50

価格設定

入力価格$0.5 / 1Mトークン
出力価格$3 / 1Mトークン
混合価格(3:1)$1.125 / 1Mトークン
キャッシュ読み取り価格$0.05 / 1Mトークン
キャッシュ書き込み価格$0.625 / 1Mトークン

速度

トークン/秒52.6
初トークン遅延1.50s
初回答遅延107.00s

プロバイダー価格ランキング

プロバイダー価格ランキング

16 プロバイダー

最安: Together最高: Venice AI
プロバイダー入力出力
1Together最安
$0
$0
2AIHubMix
$0.28
$1.69
3OpenRouter
$0.325
$1.95
4Kilo Gateway
$0.325
$1.95
5NanoGPT
$0.45
$2.7
6Alibabaプライマリ
$0.5
$3
7OpenCode Go
$0.5
$3
8Alibaba (China)
$0.5
$3
9ZenMux
$0.5
$3
10FrogBot
$0.5
$3
11Vercel AI Gateway
$0.5
$3
12LLM Gateway
$0.5
$3
13Together AI
$0.5
$3
14Auriko
$0.5
$3
15OrcaRouter
$0.5
$3
16Venice AI
$0.625
$3.75

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク