メインコンテンツへスキップ

Qwen3.5 4B (Non-reasoning)

AlibabaQwenOpen WeightApache 2.0 · Commercial OK

説明

Qwen3.5-4B is a 4 billion parameter vision-language model using Gated DeltaNet hybrid architecture with a 3:1 ratio of linear attention to full softmax attention. It supports 262K native context length and delivers strong performance for its size across knowledge, reasoning, coding, and multilingual tasks.

リリース日
2026-03-02
パラメータ
4.0B
コンテキスト長
モダリティ

能力レーダー

19
general
14
coding
71
reasoning
40
science推定
70
agents
50
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools78
47.0
LS
Code Ranking292
26.0
AA
General Ranking222
46.0
AA
Science281
39.0
AA

ベンチマークスコア (LLM Stats)

Agents

t2-bench79.9%自己申告
BFCL-V450.3%自己申告
VITA-Bench22.0%自己申告
DeepPlanning17.6%自己申告

Biology

GPQA76.2%自己申告

Chemistry

SuperGPQA52.9%自己申告

Communication

Multi-Challenge49.0%自己申告

Finance

MMLU-Pro79.1%自己申告
MMLU-ProX71.5%自己申告

General

IFEval89.8%自己申告
MMLU-Redux88.8%自己申告
C-Eval85.1%自己申告
Global PIQA78.9%自己申告
MAXIFE78.0%自己申告
MMMLU76.1%自己申告
Include71.0%自己申告
IFBench59.2%自己申告
LiveCodeBench v655.8%自己申告
NOVA-6354.3%自己申告
LongBench v250.0%自己申告

Language

WMT24++66.6%自己申告

Long Context

AA-LCR57.0%自己申告

Math

HMMT2576.8%自己申告
HMMT 202574.0%自己申告
PolyMATH51.1%自己申告

AA評価指数

Intelligence Index
22.6
Coding Index
13.7
Tau2
0.9
Gpqa
0.7
Ifbench
0.3
Lcr
0.3
Scicode
0.2
Terminalbench Hard
0.1
Hle
0.1

LLM Statsカテゴリスコア

Biology
80
Language
80
Structured Output
70
Tool Calling
70
Finance
70
General
70
Healthcare
70
Instruction Following
70
Legal
70
Math
70
Physics
70
Chemistry
60
Reasoning
60
Spatial Reasoning
50
Vision
50
Communication
50
Economics
50
Long Context
50
Multimodal
50
Agents
40

価格設定

入力価格$0.03 / 1M tokens
出力価格$0.15 / 1M tokens
混合価格(3:1)$0.06 / 1M tokens

速度

トークン/秒216.4 tokens/s
初トークン遅延0.25s
初回答遅延0.25s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク