Qwen3.5 4B (Non-reasoning)
AlibabaQwenOpen WeightApache 2.0 · Commercial OK
설명
Qwen3.5-4B is a 4 billion parameter vision-language model using Gated DeltaNet hybrid architecture with a 3:1 ratio of linear attention to full softmax attention. It supports 262K native context length and delivers strong performance for its size across knowledge, reasoning, coding, and multilingual tasks.
출시일
2026-03-02
파라미터
4.0B
컨텍스트 길이
—
모달리티
—
능력 레이더
19
general
14
coding
71
reasoning
40
science추정
70
agents
50
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Agents & Tools | 78 | 47.0 | LS |
| Code Ranking | 292 | 26.0 | AA |
| General Ranking | 222 | 46.0 | AA |
| Science | 281 | 39.0 | AA |
벤치마크 점수 (LLM Stats)
Agents
t2-bench
79.9%자체 보고
BFCL-V4
50.3%자체 보고
VITA-Bench
22.0%자체 보고
DeepPlanning
17.6%자체 보고
Biology
GPQA
76.2%자체 보고
Chemistry
SuperGPQA
52.9%자체 보고
Communication
Multi-Challenge
49.0%자체 보고
Finance
MMLU-Pro
79.1%자체 보고
MMLU-ProX
71.5%자체 보고
General
IFEval
89.8%자체 보고
MMLU-Redux
88.8%자체 보고
C-Eval
85.1%자체 보고
Global PIQA
78.9%자체 보고
MAXIFE
78.0%자체 보고
MMMLU
76.1%자체 보고
Include
71.0%자체 보고
IFBench
59.2%자체 보고
LiveCodeBench v6
55.8%자체 보고
NOVA-63
54.3%자체 보고
LongBench v2
50.0%자체 보고
Language
WMT24++
66.6%자체 보고
Long Context
AA-LCR
57.0%자체 보고
Math
HMMT25
76.8%자체 보고
HMMT 2025
74.0%자체 보고
PolyMATH
51.1%자체 보고
AA 평가 지수
Intelligence Index22.6
Coding Index13.7
Tau20.9
Gpqa0.7
Ifbench0.3
Lcr0.3
Scicode0.2
Terminalbench Hard0.1
Hle0.1
LLM Stats 카테고리 점수
Biology80
Language80
Structured Output70
Tool Calling70
Finance70
General70
Healthcare70
Instruction Following70
Legal70
Math70
Physics70
Chemistry60
Reasoning60
Spatial Reasoning50
Vision50
Communication50
Economics50
Long Context50
Multimodal50
Agents40
가격
입력 가격$0.03 / 1M tokens
출력 가격$0.15 / 1M tokens
혼합 가격 (3:1)$0.06 / 1M tokens
속도
토큰/초216.4 tokens/s
첫 토큰 지연0.25s
첫 응답 지연0.25s
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다