Qwen3.5 0.8B (Non-reasoning)
AlibabaQwenOpen WeightApache 2.0 · Commercial OK
Description
Qwen3.5-0.8B is a 0.8 billion parameter vision-language model using Gated DeltaNet hybrid architecture with a 3:1 ratio of linear attention to full softmax attention. It supports 262K native context length and features both thinking and non-thinking modes.
Date de sortie
2026-03-02
Paramètres
800M
Longueur du contexte
41K
Modalités
text
Radar de capacités
9
general
1
coding
24
reasoning
13
scienceest.
20
agents
0
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Agents & Tools | 100 | 17.0 | LS |
| Code Ranking | 463 | 3.0 | AA |
| General Ranking | 407 | 24.0 | AA |
| Science | 474 | 10.0 | AA |
Scores de benchmarks (LLM Stats)
Agents
BFCL-V4
25.3%Aut.
t2-bench
11.6%Aut.
Biology
GPQA
11.9%Aut.
Chemistry
SuperGPQA
21.3%Aut.
Communication
Multi-Challenge
18.9%Aut.
Finance
MMLU-Pro
42.3%Aut.
MMLU-ProX
34.6%Aut.
General
MMLU-Redux
59.5%Aut.
Global PIQA
59.4%Aut.
C-Eval
50.5%Aut.
MMMLU
44.3%Aut.
IFEval
44.0%Aut.
NOVA-63
42.4%Aut.
Include
40.6%Aut.
MAXIFE
39.2%Aut.
LongBench v2
26.1%Aut.
IFBench
21.0%Aut.
Language
WMT24++
27.2%Aut.
Long Context
AA-LCR
4.7%Aut.
Math
PolyMATH
8.2%Aut.
Indices d'évaluation AA
Intelligence Index9.9
Coding Index1.0
Tau20.7
Gpqa0.2
Ifbench0.2
Lcr0.1
Hle0.0
Scicode0.0
Terminalbench Hard0.0
Scores par catégorie LLM Stats
Structured Output40
General40
Language40
Math40
Finance30
Healthcare30
Instruction Following30
Legal30
Physics30
Reasoning30
Tool Calling20
Agents20
Chemistry20
Communication20
Economics20
Long Context20
Spatial Reasoning10
Vision10
Biology10
Multimodal10
Tarification
Prix d'entrée$0.01 / 1M tokens
Prix de sortie$0.05 / 1M tokens
Prix mixte (3:1)$0.02 / 1M tokens
Vitesse
Tokens/sec367.0 tokens/s
Délai du premier token0.48s
Temps de réponse0.48s
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible