Qwen3.5 4B (Non-reasoning)
AlibabaQwenOpen WeightApache 2.0 · Commercial OK
説明
Qwen3.5-4B is a 4 billion parameter vision-language model using Gated DeltaNet hybrid architecture with a 3:1 ratio of linear attention to full softmax attention. It supports 262K native context length and delivers strong performance for its size across knowledge, reasoning, coding, and multilingual tasks.
リリース日
2026-03-02
パラメータ
4.0B
コンテキスト長
—
モダリティ
—
能力レーダー
19
general
14
coding
71
reasoning
40
science推定
70
agents
50
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 78 | 47.0 | LS |
| Code Ranking | 292 | 26.0 | AA |
| General Ranking | 222 | 46.0 | AA |
| Science | 281 | 39.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
t2-bench
79.9%自己申告
BFCL-V4
50.3%自己申告
VITA-Bench
22.0%自己申告
DeepPlanning
17.6%自己申告
Biology
GPQA
76.2%自己申告
Chemistry
SuperGPQA
52.9%自己申告
Communication
Multi-Challenge
49.0%自己申告
Finance
MMLU-Pro
79.1%自己申告
MMLU-ProX
71.5%自己申告
General
IFEval
89.8%自己申告
MMLU-Redux
88.8%自己申告
C-Eval
85.1%自己申告
Global PIQA
78.9%自己申告
MAXIFE
78.0%自己申告
MMMLU
76.1%自己申告
Include
71.0%自己申告
IFBench
59.2%自己申告
LiveCodeBench v6
55.8%自己申告
NOVA-63
54.3%自己申告
LongBench v2
50.0%自己申告
Language
WMT24++
66.6%自己申告
Long Context
AA-LCR
57.0%自己申告
Math
HMMT25
76.8%自己申告
HMMT 2025
74.0%自己申告
PolyMATH
51.1%自己申告
AA評価指数
Intelligence Index22.6
Coding Index13.7
Tau20.9
Gpqa0.7
Ifbench0.3
Lcr0.3
Scicode0.2
Terminalbench Hard0.1
Hle0.1
LLM Statsカテゴリスコア
Biology80
Language80
Structured Output70
Tool Calling70
Finance70
General70
Healthcare70
Instruction Following70
Legal70
Math70
Physics70
Chemistry60
Reasoning60
Spatial Reasoning50
Vision50
Communication50
Economics50
Long Context50
Multimodal50
Agents40
価格設定
入力価格$0.03 / 1M tokens
出力価格$0.15 / 1M tokens
混合価格(3:1)$0.06 / 1M tokens
速度
トークン/秒216.4 tokens/s
初トークン遅延0.25s
初回答遅延0.25s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません