Qwen3.5 2B (Reasoning)
AlibabaQwenオープンウエイトApache 2.0 · 商用利用可
説明
Qwen3.5-2B is a 2 billion parameter vision-language model using Gated DeltaNet hybrid architecture with a 3:1 ratio of linear attention to full softmax attention. It supports 262K native context length and features both thinking and non-thinking modes.
リリース日
2026-03-02
パラメータ
2.0B
コンテキスト長
—
モダリティ
—
能力レーダー
8
general
17
coding
46
reasoning
22
science推定
50
agents
30
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| エージェント能力 | 96 | 47.0 | LS |
| コーディングランキング | 346 | 22.0 | AA |
| 総合ランキング | 344 | 32.0 | AA |
| 科学 | 463 | 16.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
t2-bench
48.8%自己申告
BFCL-V4
43.6%自己申告
Biology
GPQA
51.6%自己申告
Chemistry
SuperGPQA
37.5%自己申告
Communication
Multi-Challenge
33.7%自己申告
Finance
MMLU-Pro
66.5%自己申告
MMLU-ProX
52.3%自己申告
General
MMLU-Redux
79.6%自己申告
IFEval
78.6%自己申告
C-Eval
73.2%自己申告
Global PIQA
69.3%自己申告
MMMLU
63.1%自己申告
MAXIFE
60.6%自己申告
Include
55.4%自己申告
NOVA-63
46.4%自己申告
IFBench
41.3%自己申告
LongBench v2
38.7%自己申告
Language
WMT24++
45.8%自己申告
Long Context
AA-LCR
25.6%自己申告
Math
PolyMATH
26.1%自己申告
AA評価指数
Coding Index19.7
Intelligence Index10.2
Tau20.7
Gpqa0.5
Ifbench0.3
Terminalbench V2 10.3
Lcr0.2
Tau Banking0.1
Terminalbench Hard0.0
Scicode0.0
Hle0.0
LLM Statsカテゴリスコア
Instruction Following60
Language60
Structured Output60
General60
Legal50
Math50
Physics50
Reasoning50
Finance50
Healthcare50
Agents50
Biology50
Tool Calling50
Chemistry40
Economics40
Long Context30
Multimodal30
Spatial Reasoning30
Communication30
Vision30
価格設定
入力価格$0.02 / 1Mトークン
出力価格$0.1 / 1Mトークン
混合価格(3:1)$0.04 / 1Mトークン
速度
トークン/秒35.6
初トークン遅延0.48s
初回答遅延56.73s
プロバイダー価格ランキング
プロバイダー価格ランキング
1 プロバイダー
プロバイダー入力出力
1Alibabaプライマリ
$0.02
$0.1
このモデルの異なるAPIプロバイダー間の価格を比較。