Qwen3.5 4B (Non-reasoning)

AlibabaQwen오픈 웨이트Apache 2.0 · 상업적 사용 가능

설명

Qwen3.5-4B is a 4 billion parameter vision-language model using Gated DeltaNet hybrid architecture with a 3:1 ratio of linear attention to full softmax attention. It supports 262K native context length and delivers strong performance for its size across knowledge, reasoning, coding, and multilingual tasks.

출시일

2026-03-02

파라미터

4.0B

컨텍스트 길이

—

모달리티

—

능력 레이더

general

coding

reasoning

science추정

agents

multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인	#순위	점수	소스
에이전트형 역량	95	47.0	LS
코딩 랭킹	310	27.0	AA
종합 랭킹	248	42.0	AA
과학	304	38.0	AA

벤치마크 점수 (LLM Stats)

Agents

t2-bench

79.9%자체 보고

BFCL-V4

50.3%자체 보고

VITA-Bench

22.0%자체 보고

DeepPlanning

17.6%자체 보고

Biology

GPQA

76.2%자체 보고

Chemistry

SuperGPQA

52.9%자체 보고

Communication

Multi-Challenge

49.0%자체 보고

Finance

MMLU-Pro

79.1%자체 보고

MMLU-ProX

71.5%자체 보고

General

IFEval

89.8%자체 보고

MMLU-Redux

88.8%자체 보고

C-Eval

85.1%자체 보고

Global PIQA

78.9%자체 보고

MAXIFE

78.0%자체 보고

MMMLU

76.1%자체 보고

Include

71.0%자체 보고

IFBench

59.2%자체 보고

LiveCodeBench v6

55.8%자체 보고

NOVA-63

54.3%자체 보고

LongBench v2

50.0%자체 보고

Language

WMT24++

66.6%자체 보고

Long Context

AA-LCR

57.0%자체 보고

Math

HMMT25

76.8%자체 보고

HMMT 2025

74.0%자체 보고

PolyMATH

51.1%자체 보고

AA 평가 지수

Coding Index

20.3

Intelligence Index

16.0

Tau2

0.9

Gpqa

0.7

Ifbench

0.3

Lcr

0.3

Terminalbench V2 1

0.2

Scicode

0.2

Terminalbench Hard

0.1

Hle

0.1

Tau Banking

0.0

LLM Stats 카테고리 점수

Language

Biology

Instruction Following

Legal

Math

Physics

Structured Output

Finance

General

Healthcare

Tool Calling

Reasoning

Chemistry

Long Context

Multimodal

Spatial Reasoning

Communication

Economics

Vision

Agents

가격

입력 가격$0.03 / 1M 토큰

출력 가격$0.15 / 1M 토큰

혼합 가격 (3:1)$0.06 / 1M 토큰

속도

토큰/초40.6

첫 토큰 지연0.43s

첫 응답 지연0.43s

공급자 가격 순위

1개 공급자

공급자입력출력

1Alibaba주요

$0.03

$0.15

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크

LLM Stats Artificial Analysis