Qwen3.5 27B (Reasoning)
AlibabaQwenOpen WeightApache 2.0 · Commercial OK
説明
Qwen3.5-27B is a multimodal dense foundation model with 27 billion parameters. It combines strong reasoning, coding, multilingual, long-context, and visual understanding performance in a production-friendly open-weight package with a native 262K context window.
リリース日
2026-02-24
パラメータ
27.0B
コンテキスト長
262K
モダリティ
image, text, video
能力レーダー
38
general
36
coding
86
reasoning
57
science推定
60
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 51 | 57.0 | LS |
| Code Ranking | 84 | 65.0 | AA |
| General Ranking | 43 | 80.0 | AA |
| Multimodal Ranking | 60 | 70.0 | LS |
| Reasoning | 54 | 67.0 | LS |
| Science | 63 | 68.0 | AA |
ベンチマークスコア (LLM Stats)
3d
SUNRGBD
0.35 / 100自己申告
Hypersim
0.13 / 100自己申告
Agents
t2-bench
79.0%自己申告
BFCL-V4
68.5%自己申告
AndroidWorld_SR
64.2%自己申告
WideSearch
61.1%自己申告
BrowseComp
61.0%自己申告
FullStackBench en
60.1%自己申告
TIR-Bench
59.8%自己申告
FullStackBench zh
57.4%自己申告
OSWorld-Verified
56.2%自己申告
VITA-Bench
41.9%自己申告
Terminal-Bench 2.0
41.6%自己申告
DeepPlanning
22.6%自己申告
Biology
GPQA
85.5%自己申告
Chemistry
SuperGPQA
65.6%自己申告
Code
SWE-Bench Verified
72.4%自己申告
Communication
Multi-Challenge
60.8%自己申告
Embodied
EmbSpatialBench
0.84 / 100自己申告
Finance
MMLU-Pro
86.1%自己申告
MMLU-ProX
82.2%自己申告
General
IFEval
95.0%自己申告
MMLU-Redux
93.2%自己申告
C-Eval
90.5%自己申告
MAXIFE
88.0%自己申告
Global PIQA
87.5%自己申告
MMMLU
85.9%自己申告
MMMU
82.3%自己申告
Include
81.6%自己申告
MMStar
81.0%自己申告
LiveCodeBench v6
80.7%自己申告
IFBench
76.5%自己申告
MMMU-Pro
75.0%自己申告
LongBench v2
60.6%自己申告
NOVA-63
58.1%自己申告
SimpleVQA
0.56 / 100自己申告
Grounding
RefCOCO-avg
0.91 / 100自己申告
ScreenSpot Pro
70.3%自己申告
RefSpatialBench
0.68 / 100自己申告
Healthcare
VideoMMMU
82.3%自己申告
SlakeVQA
80.0%自己申告
MedXpertQA
62.4%自己申告
PMC-VQA
62.4%自己申告
Image To Text
OCRBench
89.4%自己申告
Language
LingoQA
82.0%自己申告
WMT24++
77.6%自己申告
Long Context
MLVU
85.9%自己申告
LVBench
73.6%自己申告
AA-LCR
66.1%自己申告
MMLongBench-Doc
0.60 / 100自己申告
Math
HMMT 2025
92.0%自己申告
HMMT25
89.8%自己申告
MathVista-Mini
87.8%自己申告
DynaMath
87.7%自己申告
MathVision
86.0%自己申告
CodeForces
0.81 / 3000自己申告
PolyMATH
71.2%自己申告
Humanity's Last Exam
48.5%自己申告
Multimodal
VLMsAreBlind
96.9%自己申告
V*
93.7%自己申告
AI2D
92.9%自己申告
MMBench-V1.1
92.6%自己申告
OmniDocBench 1.5
88.9%自己申告
VideoMME w sub.
87.0%自己申告
VideoMME w/o sub.
82.8%自己申告
CC-OCR
81.0%自己申告
CharXiv-R
79.5%自己申告
MVBench
74.6%自己申告
MMVU
73.3%自己申告
BabyVision
44.6%自己申告
ZEROBench-Sub
0.36 / 100自己申告
Nuscene
15.2%自己申告
ZEROBench
0.10 / 100自己申告
Reasoning
CountBench
0.98 / 100自己申告
Hallusion Bench
70.0%自己申告
BrowseComp-zh
62.1%自己申告
ERQA
60.5%自己申告
Seal-0
47.2%自己申告
OJBench
40.1%自己申告
Spatial Reasoning
RealWorldQA
83.7%自己申告
Vision
ODinW
41.1%自己申告
AA評価指数
Intelligence Index42.1
Coding Index34.9
Tau20.9
Gpqa0.9
Ifbench0.8
Lcr0.7
Scicode0.4
Terminalbench Hard0.3
Hle0.2
LLM Statsカテゴリスコア
Biology90
Instruction Following90
Structured Output80
Text-to-image80
Video80
Chemistry80
Embodied80
Finance80
General80
Grounding80
Image To Text80
Language80
Legal80
Math80
Physics80
Spatial Reasoning70
Vision70
Economics70
Frontend Development70
Healthcare70
Long Context70
Multimodal70
Reasoning70
Tool Calling60
Agents60
Code60
Communication60
Search60
Spatial20
3d20
価格設定
入力価格$0.3 / 1M tokens
出力価格$2.4 / 1M tokens
混合価格(3:1)$0.825 / 1M tokens
速度
トークン/秒87.6 tokens/s
初トークン遅延1.40s
初回答遅延24.23s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| Novita | 300K | 2.4M |