メインコンテンツへスキップ

Qwen3 32B (Reasoning)

AlibabaQwen

リリース日

2025-04-28

パラメータ

—

コンテキスト長

262K

モダリティ

audio, image, text, video

能力レーダー

31

general

50

coding

78

reasoning

44

science推定

60

agents

80

multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン	#順位	スコア	ソース
コーディングランキング	363	21.0	AA
総合ランキング	297	37.0	AA
数学的推論	86	80.0	AA
科学	219	47.0	AA

ベンチマークスコア (LLM Stats)

3d

SUNRGBD

0.33 / 100自己申告

Hypersim

0.13 / 100自己申告

Agents

t2-bench

81.2%自己申告

AndroidWorld_SR

71.1%自己申告

BFCL-V4

67.3%自己申告

BrowseComp

61.0%自己申告

FullStackBench en

58.1%自己申告

WideSearch

57.1%自己申告

TIR-Bench

55.5%自己申告

FullStackBench zh

55.0%自己申告

OSWorld-Verified

54.5%自己申告

Terminal-Bench 2.0

40.5%自己申告

VITA-Bench

31.9%自己申告

DeepPlanning

22.8%自己申告

Biology

GPQA

84.2%自己申告

Chemistry

SuperGPQA

63.4%自己申告

Code

SWE-Bench Verified

69.2%自己申告

Communication

Multi-Challenge

60.0%自己申告

Embodied

EmbSpatialBench

0.83 / 100自己申告

Finance

MMLU-Pro

85.3%自己申告

MMLU-ProX

81.0%自己申告

General

MMLU-Redux

93.3%自己申告

IFEval

91.9%自己申告

C-Eval

90.2%自己申告

MAXIFE

86.6%自己申告

Global PIQA

86.6%自己申告

MMMLU

85.2%自己申告

MMStar

81.9%自己申告

MMMU

81.4%自己申告

Include

79.7%自己申告

MMMU-Pro

75.1%自己申告

LiveCodeBench v6

74.6%自己申告

IFBench

70.2%自己申告

LongBench v2

59.0%自己申告

SimpleVQA

0.58 / 100自己申告

NOVA-63

57.1%自己申告

Grounding

RefCOCO-avg

0.89 / 100自己申告

ScreenSpot Pro

68.6%自己申告

RefSpatialBench

0.64 / 100自己申告

Healthcare

VideoMMMU

80.4%自己申告

SlakeVQA

78.7%自己申告

PMC-VQA

62.0%自己申告

MedXpertQA

61.4%自己申告

Image To Text

OCRBench

91.0%自己申告

Language

LingoQA

79.2%自己申告

WMT24++

76.3%自己申告

Long Context

MLVU

85.6%自己申告

LVBench

71.4%自己申告

MMLongBench-Doc

0.59 / 100自己申告

AA-LCR

58.5%自己申告

Math

HMMT25

89.2%自己申告

HMMT 2025

89.0%自己申告

MathVista-Mini

86.2%自己申告

DynaMath

85.0%自己申告

MathVision

83.9%自己申告

CodeForces

0.82 / 3000自己申告

PolyMATH

64.4%自己申告

Humanity's Last Exam

47.4%自己申告

Multimodal

VLMsAreBlind

97.0%自己申告

V*

92.7%自己申告

AI2D

92.6%自己申告

MMBench-V1.1

91.5%自己申告

OmniDocBench 1.5

89.3%自己申告

VideoMME w sub.

86.6%自己申告

VideoMME w/o sub.

82.5%自己申告

CC-OCR

80.7%自己申告

CharXiv-R

77.5%自己申告

MVBench

74.8%自己申告

MMVU

72.3%自己申告

BabyVision

38.4%自己申告

ZEROBench-Sub

0.34 / 100自己申告

Nuscene

14.6%自己申告

ZEROBench

0.08 / 100自己申告

Reasoning

CountBench

0.98 / 100自己申告

BrowseComp-zh

69.5%自己申告

Hallusion Bench

67.9%自己申告

ERQA

64.8%自己申告

Seal-0

41.4%自己申告

OJBench

36.0%自己申告

Spatial Reasoning

RealWorldQA

84.1%自己申告

Vision

ODinW

42.6%自己申告

AA評価指数

Math Index

73.0

Intelligence Index

10.5

Math 500

1.0

Aime

0.8

Mmlu Pro

0.8

Aime 25

0.7

Gpqa

0.7

Livecodebench

0.5

Ifbench

0.4

Scicode

0.4

Tau2

0.3

Hle

0.1

Terminalbench Hard

0.0

Lcr

0.0

LLM Statsカテゴリスコア

Math

80

Physics

80

Structured Output

80

Image To Text

80

Instruction Following

80

Language

80

Legal

80

Embodied

80

Finance

80

General

80

Biology

80

Text-to-image

80

Video

80

Multimodal

70

Reasoning

70

Spatial Reasoning

70

Long Context

70

Frontend Development

70

Grounding

70

Healthcare

70

Chemistry

70

Vision

70

Search

60

Code

60

Communication

60

Economics

60

Tool Calling

60

Agents

50

3d

20

Spatial

10

価格設定

入力価格$0.195 / 1Mトークン

出力価格$0.52 / 1Mトークン

混合価格（3:1）$0.276 / 1Mトークン

速度

トークン/秒86.3

初トークン遅延1.06s

初回答遅延24.23s

プロバイダー価格ランキング

プロバイダー価格ランキング

1 プロバイダー

プロバイダー入力出力

1Alibabaプライマリ

$0.195

$0.52

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク

Artificial Analysis