Qwen3.5 27B (Reasoning)
AlibabaQwenオープンウエイトApache 2.0 · 商用利用可
説明
Qwen3.5-27B is a multimodal dense foundation model with 27 billion parameters. It combines strong reasoning, coding, multilingual, long-context, and visual understanding performance in a production-friendly open-weight package with a native 262K context window.
リリース日
2026-02-24
パラメータ
27.0B
コンテキスト長
262K
モダリティ
audio, image, text, video
能力レーダー
31
general
40
coding
86
reasoning
57
science推定
60
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| エージェント能力 | 49 | 57.0 | LS |
| コーディングランキング | 82 | 71.0 | AA |
| 総合ランキング | 59 | 74.0 | AA |
| マルチモーダルランキング | 69 | 70.0 | LS |
| 推論 | 58 | 67.0 | LS |
| 科学 | 76 | 65.0 | AA |
ベンチマークスコア (LLM Stats)
3d
SUNRGBD
0.35 / 100自己申告
Hypersim
0.13 / 100自己申告
Agents
t2-bench
79.0%自己申告
BFCL-V4
68.5%自己申告
AndroidWorld_SR
64.2%自己申告
WideSearch
61.1%自己申告
BrowseComp
61.0%自己申告
FullStackBench en
60.1%自己申告
TIR-Bench
59.8%自己申告
FullStackBench zh
57.4%自己申告
OSWorld-Verified
56.2%自己申告
VITA-Bench
41.9%自己申告
Terminal-Bench 2.0
41.6%自己申告
DeepPlanning
22.6%自己申告
Biology
GPQA
85.5%自己申告
Chemistry
SuperGPQA
65.6%自己申告
Code
SWE-Bench Verified
72.4%自己申告
Communication
Multi-Challenge
60.8%自己申告
Embodied
EmbSpatialBench
0.84 / 100自己申告
Finance
MMLU-Pro
86.1%自己申告
MMLU-ProX
82.2%自己申告
General
IFEval
95.0%自己申告
MMLU-Redux
93.2%自己申告
C-Eval
90.5%自己申告
MAXIFE
88.0%自己申告
Global PIQA
87.5%自己申告
MMMLU
85.9%自己申告
MMMU
82.3%自己申告
Include
81.6%自己申告
MMStar
81.0%自己申告
LiveCodeBench v6
80.7%自己申告
IFBench
76.5%自己申告
MMMU-Pro
75.0%自己申告
LongBench v2
60.6%自己申告
NOVA-63
58.1%自己申告
SimpleVQA
0.56 / 100自己申告
Grounding
RefCOCO-avg
0.91 / 100自己申告
ScreenSpot Pro
70.3%自己申告
RefSpatialBench
0.68 / 100自己申告
Healthcare
VideoMMMU
82.3%自己申告
SlakeVQA
80.0%自己申告
MedXpertQA
62.4%自己申告
PMC-VQA
62.4%自己申告
Image To Text
OCRBench
89.4%自己申告
Language
LingoQA
82.0%自己申告
WMT24++
77.6%自己申告
Long Context
MLVU
85.9%自己申告
LVBench
73.6%自己申告
AA-LCR
66.1%自己申告
MMLongBench-Doc
0.60 / 100自己申告
Math
HMMT 2025
92.0%自己申告
HMMT25
89.8%自己申告
MathVista-Mini
87.8%自己申告
DynaMath
87.7%自己申告
MathVision
86.0%自己申告
CodeForces
0.81 / 3000自己申告
PolyMATH
71.2%自己申告
Humanity's Last Exam
48.5%自己申告
Multimodal
VLMsAreBlind
96.9%自己申告
V*
93.7%自己申告
AI2D
92.9%自己申告
MMBench-V1.1
92.6%自己申告
OmniDocBench 1.5
88.9%自己申告
VideoMME w sub.
87.0%自己申告
VideoMME w/o sub.
82.8%自己申告
CC-OCR
81.0%自己申告
CharXiv-R
79.5%自己申告
MVBench
74.6%自己申告
MMVU
73.3%自己申告
BabyVision
44.6%自己申告
ZEROBench-Sub
0.36 / 100自己申告
Nuscene
15.2%自己申告
ZEROBench
0.10 / 100自己申告
Reasoning
CountBench
0.98 / 100自己申告
Hallusion Bench
70.0%自己申告
BrowseComp-zh
62.1%自己申告
ERQA
60.5%自己申告
Seal-0
47.2%自己申告
OJBench
40.1%自己申告
Spatial Reasoning
RealWorldQA
83.7%自己申告
Vision
ODinW
41.1%自己申告
AA評価指数
Intelligence Index33.8
Tau20.9
Gpqa0.9
Ifbench0.8
Lcr0.7
Scicode0.4
Terminalbench Hard0.3
Hle0.2
LLM Statsカテゴリスコア
Instruction Following90
Biology90
Image To Text80
Language80
Legal80
Math80
Physics80
Structured Output80
Embodied80
Finance80
General80
Grounding80
Chemistry80
Text-to-image80
Video80
Long Context70
Multimodal70
Reasoning70
Spatial Reasoning70
Frontend Development70
Healthcare70
Economics70
Vision70
Search60
Agents60
Code60
Communication60
Tool Calling60
Spatial20
3d20
価格設定
入力価格$0.3 / 1Mトークン
出力価格$2.4 / 1Mトークン
混合価格(3:1)$0.825 / 1Mトークン
速度
トークン/秒86.8
初トークン遅延1.47s
初回答遅延24.52s
プロバイダー価格ランキング
プロバイダー価格ランキング
10 プロバイダー
最安: Novita最高: NanoGPT
プロバイダー入力出力
1Novita最安
$0
$0
2OrcaRouter
$0.086
$0.688
3OpenRouter
$0.195
$1.56
4Kilo Gateway
$0.195
$1.56
5SiliconFlow (China)
$0.26
$2.09
6Alibabaプライマリ
$0.3
$2.4
7Hugging Face
$0.3
$2.4
8NovitaAI
$0.3
$2.4
9Mixlayer
$0.3
$2.4
10NanoGPT
$0.306
$0.306
このモデルの異なるAPIプロバイダー間の価格を比較。