メインコンテンツへスキップ

Qwen3 235B A22B (Non-reasoning)

AlibabaQwenOpen WeightApache 2.0 · Commercial OK

説明

Qwen3 235B A22B is a large language model developed by Alibaba, featuring a Mixture-of-Experts (MoE) architecture with 235 billion total parameters and 22 billion activated parameters. It achieves competitive results in benchmark evaluations of coding, math, general capabilities, and more, compared to other top-tier models.

リリース日
2025-04-28
パラメータ
235.0B
コンテキスト長
131K
モダリティ
text

能力レーダー

33
general
23
coding
40
reasoning
39
science推定
70
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking351
19.0
AA
General Ranking286
38.0
AA
Math Reasoning227
39.0
AA
Reasoning32
79.0
LS
Science275
40.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA47.5%自己申告

Chemistry

SuperGPQA44.1%自己申告

Code

EvalPlus0.78 / 100自己申告
LiveCodeBench70.7%自己申告
Aider61.8%自己申告

Creativity

Arena Hard95.6%自己申告

Finance

MMLU87.8%自己申告
MMLU-Pro68.2%自己申告

General

MMLU-Redux87.4%自己申告
MMMLU86.7%自己申告
MBPP0.81 / 100自己申告
LiveBench77.1%自己申告
Include73.5%自己申告
MultiLF71.9%自己申告
BFCL70.8%自己申告
MultiPL-E65.9%自己申告

Language

BBH88.9%自己申告

Math

GSM8k94.4%自己申告
AIME 202485.7%自己申告
MGSM83.5%自己申告
AIME 202581.5%自己申告
MATH71.8%自己申告

Reasoning

CRUX-O0.79 / 100自己申告

AA評価指数

Math Index
23.7
Intelligence Index
17.0
Coding Index
14.0
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.6
Ifbench
0.4
Livecodebench
0.3
Aime
0.3
Scicode
0.3
Tau2
0.3
Aime 25
0.2
Terminalbench Hard
0.1
Hle
0.0
Lcr
0.0

LLM Statsカテゴリスコア

Writing
100
Creativity
100
Language
80
Math
80
Reasoning
80
Tool Calling
70
Code
70
Finance
70
General
70
Healthcare
70
Legal
70
Biology
50
Chemistry
50
Physics
50
Economics
40

価格設定

入力価格$0.45 / 1M tokens
出力価格$1.8 / 1M tokens
混合価格(3:1)$0.787 / 1M tokens

速度

トークン/秒64.1 tokens/s
初トークン遅延1.24s
初回答遅延1.24s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク