メインコンテンツへスキップ

Qwen3.5 4B (Non-reasoning)

AlibabaQwenオープンウエイトApache 2.0 · 商用利用可

説明

Qwen3.5-4B is a 4 billion parameter vision-language model using Gated DeltaNet hybrid architecture with a 3:1 ratio of linear attention to full softmax attention. It supports 262K native context length and delivers strong performance for its size across knowledge, reasoning, coding, and multilingual tasks.

リリース日
2026-03-02
パラメータ
4.0B
コンテキスト長
モダリティ

能力レーダー

14
general
20
coding
71
reasoning
40
science推定
70
agents
50
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
エージェント能力95
47.0
LS
コーディングランキング310
27.0
AA
総合ランキング248
42.0
AA
科学304
38.0
AA

ベンチマークスコア (LLM Stats)

Agents

t2-bench79.9%自己申告
BFCL-V450.3%自己申告
VITA-Bench22.0%自己申告
DeepPlanning17.6%自己申告

Biology

GPQA76.2%自己申告

Chemistry

SuperGPQA52.9%自己申告

Communication

Multi-Challenge49.0%自己申告

Finance

MMLU-Pro79.1%自己申告
MMLU-ProX71.5%自己申告

General

IFEval89.8%自己申告
MMLU-Redux88.8%自己申告
C-Eval85.1%自己申告
Global PIQA78.9%自己申告
MAXIFE78.0%自己申告
MMMLU76.1%自己申告
Include71.0%自己申告
IFBench59.2%自己申告
LiveCodeBench v655.8%自己申告
NOVA-6354.3%自己申告
LongBench v250.0%自己申告

Language

WMT24++66.6%自己申告

Long Context

AA-LCR57.0%自己申告

Math

HMMT2576.8%自己申告
HMMT 202574.0%自己申告
PolyMATH51.1%自己申告

AA評価指数

Coding Index
20.3
Intelligence Index
16.0
Tau2
0.9
Gpqa
0.7
Ifbench
0.3
Lcr
0.3
Terminalbench V2 1
0.2
Scicode
0.2
Terminalbench Hard
0.1
Hle
0.1
Tau Banking
0.0

LLM Statsカテゴリスコア

Language
80
Biology
80
Instruction Following
70
Legal
70
Math
70
Physics
70
Structured Output
70
Finance
70
General
70
Healthcare
70
Tool Calling
70
Reasoning
60
Chemistry
60
Long Context
50
Multimodal
50
Spatial Reasoning
50
Communication
50
Economics
50
Vision
50
Agents
40

価格設定

入力価格$0.03 / 1Mトークン
出力価格$0.15 / 1Mトークン
混合価格(3:1)$0.06 / 1Mトークン

速度

トークン/秒40.6
初トークン遅延0.43s
初回答遅延0.43s

プロバイダー価格ランキング

プロバイダー価格ランキング

1 プロバイダー

プロバイダー入力出力
1Alibabaプライマリ
$0.03
$0.15

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク