Qwen3 32B (Reasoning)
AlibabaQwen
リリース日
2025-04-28
パラメータ
—
コンテキスト長
262K
モダリティ
audio, image, text, video
能力レーダー
31
general
50
coding
78
reasoning
44
science推定
60
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 363 | 21.0 | AA |
| 総合ランキング | 297 | 37.0 | AA |
| 数学的推論 | 86 | 80.0 | AA |
| 科学 | 219 | 47.0 | AA |
ベンチマークスコア (LLM Stats)
3d
SUNRGBD
0.33 / 100自己申告
Hypersim
0.13 / 100自己申告
Agents
t2-bench
81.2%自己申告
AndroidWorld_SR
71.1%自己申告
BFCL-V4
67.3%自己申告
BrowseComp
61.0%自己申告
FullStackBench en
58.1%自己申告
WideSearch
57.1%自己申告
TIR-Bench
55.5%自己申告
FullStackBench zh
55.0%自己申告
OSWorld-Verified
54.5%自己申告
Terminal-Bench 2.0
40.5%自己申告
VITA-Bench
31.9%自己申告
DeepPlanning
22.8%自己申告
Biology
GPQA
84.2%自己申告
Chemistry
SuperGPQA
63.4%自己申告
Code
SWE-Bench Verified
69.2%自己申告
Communication
Multi-Challenge
60.0%自己申告
Embodied
EmbSpatialBench
0.83 / 100自己申告
Finance
MMLU-Pro
85.3%自己申告
MMLU-ProX
81.0%自己申告
General
MMLU-Redux
93.3%自己申告
IFEval
91.9%自己申告
C-Eval
90.2%自己申告
MAXIFE
86.6%自己申告
Global PIQA
86.6%自己申告
MMMLU
85.2%自己申告
MMStar
81.9%自己申告
MMMU
81.4%自己申告
Include
79.7%自己申告
MMMU-Pro
75.1%自己申告
LiveCodeBench v6
74.6%自己申告
IFBench
70.2%自己申告
LongBench v2
59.0%自己申告
SimpleVQA
0.58 / 100自己申告
NOVA-63
57.1%自己申告
Grounding
RefCOCO-avg
0.89 / 100自己申告
ScreenSpot Pro
68.6%自己申告
RefSpatialBench
0.64 / 100自己申告
Healthcare
VideoMMMU
80.4%自己申告
SlakeVQA
78.7%自己申告
PMC-VQA
62.0%自己申告
MedXpertQA
61.4%自己申告
Image To Text
OCRBench
91.0%自己申告
Language
LingoQA
79.2%自己申告
WMT24++
76.3%自己申告
Long Context
MLVU
85.6%自己申告
LVBench
71.4%自己申告
MMLongBench-Doc
0.59 / 100自己申告
AA-LCR
58.5%自己申告
Math
HMMT25
89.2%自己申告
HMMT 2025
89.0%自己申告
MathVista-Mini
86.2%自己申告
DynaMath
85.0%自己申告
MathVision
83.9%自己申告
CodeForces
0.82 / 3000自己申告
PolyMATH
64.4%自己申告
Humanity's Last Exam
47.4%自己申告
Multimodal
VLMsAreBlind
97.0%自己申告
V*
92.7%自己申告
AI2D
92.6%自己申告
MMBench-V1.1
91.5%自己申告
OmniDocBench 1.5
89.3%自己申告
VideoMME w sub.
86.6%自己申告
VideoMME w/o sub.
82.5%自己申告
CC-OCR
80.7%自己申告
CharXiv-R
77.5%自己申告
MVBench
74.8%自己申告
MMVU
72.3%自己申告
BabyVision
38.4%自己申告
ZEROBench-Sub
0.34 / 100自己申告
Nuscene
14.6%自己申告
ZEROBench
0.08 / 100自己申告
Reasoning
CountBench
0.98 / 100自己申告
BrowseComp-zh
69.5%自己申告
Hallusion Bench
67.9%自己申告
ERQA
64.8%自己申告
Seal-0
41.4%自己申告
OJBench
36.0%自己申告
Spatial Reasoning
RealWorldQA
84.1%自己申告
Vision
ODinW
42.6%自己申告
AA評価指数
Math Index73.0
Intelligence Index10.5
Math 5001.0
Aime0.8
Mmlu Pro0.8
Aime 250.7
Gpqa0.7
Livecodebench0.5
Ifbench0.4
Scicode0.4
Tau20.3
Hle0.1
Terminalbench Hard0.0
Lcr0.0
LLM Statsカテゴリスコア
Math80
Physics80
Structured Output80
Image To Text80
Instruction Following80
Language80
Legal80
Embodied80
Finance80
General80
Biology80
Text-to-image80
Video80
Multimodal70
Reasoning70
Spatial Reasoning70
Long Context70
Frontend Development70
Grounding70
Healthcare70
Chemistry70
Vision70
Search60
Code60
Communication60
Economics60
Tool Calling60
Agents50
3d20
Spatial10
価格設定
入力価格$0.195 / 1Mトークン
出力価格$0.52 / 1Mトークン
混合価格(3:1)$0.276 / 1Mトークン
速度
トークン/秒86.3
初トークン遅延1.06s
初回答遅延24.23s
プロバイダー価格ランキング
プロバイダー価格ランキング
1 プロバイダー
プロバイダー入力出力
1Alibabaプライマリ
$0.195
$0.52
このモデルの異なるAPIプロバイダー間の価格を比較。