Qwen3.5 4B (Non-reasoning)
AlibabaQwenオープンウエイトApache 2.0 · 商用利用可
説明
Qwen3.5-4B is a 4 billion parameter vision-language model using Gated DeltaNet hybrid architecture with a 3:1 ratio of linear attention to full softmax attention. It supports 262K native context length and delivers strong performance for its size across knowledge, reasoning, coding, and multilingual tasks.
リリース日
2026-03-02
パラメータ
4.0B
コンテキスト長
—
モダリティ
—
能力レーダー
14
general
20
coding
71
reasoning
40
science推定
70
agents
50
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| エージェント能力 | 95 | 47.0 | LS |
| コーディングランキング | 310 | 27.0 | AA |
| 総合ランキング | 248 | 42.0 | AA |
| 科学 | 304 | 38.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
t2-bench
79.9%自己申告
BFCL-V4
50.3%自己申告
VITA-Bench
22.0%自己申告
DeepPlanning
17.6%自己申告
Biology
GPQA
76.2%自己申告
Chemistry
SuperGPQA
52.9%自己申告
Communication
Multi-Challenge
49.0%自己申告
Finance
MMLU-Pro
79.1%自己申告
MMLU-ProX
71.5%自己申告
General
IFEval
89.8%自己申告
MMLU-Redux
88.8%自己申告
C-Eval
85.1%自己申告
Global PIQA
78.9%自己申告
MAXIFE
78.0%自己申告
MMMLU
76.1%自己申告
Include
71.0%自己申告
IFBench
59.2%自己申告
LiveCodeBench v6
55.8%自己申告
NOVA-63
54.3%自己申告
LongBench v2
50.0%自己申告
Language
WMT24++
66.6%自己申告
Long Context
AA-LCR
57.0%自己申告
Math
HMMT25
76.8%自己申告
HMMT 2025
74.0%自己申告
PolyMATH
51.1%自己申告
AA評価指数
Coding Index20.3
Intelligence Index16.0
Tau20.9
Gpqa0.7
Ifbench0.3
Lcr0.3
Terminalbench V2 10.2
Scicode0.2
Terminalbench Hard0.1
Hle0.1
Tau Banking0.0
LLM Statsカテゴリスコア
Language80
Biology80
Instruction Following70
Legal70
Math70
Physics70
Structured Output70
Finance70
General70
Healthcare70
Tool Calling70
Reasoning60
Chemistry60
Long Context50
Multimodal50
Spatial Reasoning50
Communication50
Economics50
Vision50
Agents40
価格設定
入力価格$0.03 / 1Mトークン
出力価格$0.15 / 1Mトークン
混合価格(3:1)$0.06 / 1Mトークン
速度
トークン/秒40.6
初トークン遅延0.43s
初回答遅延0.43s
プロバイダー価格ランキング
プロバイダー価格ランキング
1 プロバイダー
プロバイダー入力出力
1Alibabaプライマリ
$0.03
$0.15
このモデルの異なるAPIプロバイダー間の価格を比較。