Qwen3 235B A22B (Non-reasoning)
AlibabaQwenOpen WeightApache 2.0 · Commercial OK
説明
Qwen3 235B A22B is a large language model developed by Alibaba, featuring a Mixture-of-Experts (MoE) architecture with 235 billion total parameters and 22 billion activated parameters. It achieves competitive results in benchmark evaluations of coding, math, general capabilities, and more, compared to other top-tier models.
リリース日
2025-04-28
パラメータ
235.0B
コンテキスト長
131K
モダリティ
text
能力レーダー
33
general
23
coding
40
reasoning
39
science推定
70
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 351 | 19.0 | AA |
| General Ranking | 286 | 38.0 | AA |
| Math Reasoning | 227 | 39.0 | AA |
| Reasoning | 32 | 79.0 | LS |
| Science | 275 | 40.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
47.5%自己申告
Chemistry
SuperGPQA
44.1%自己申告
Code
EvalPlus
0.78 / 100自己申告
LiveCodeBench
70.7%自己申告
Aider
61.8%自己申告
Creativity
Arena Hard
95.6%自己申告
Finance
MMLU
87.8%自己申告
MMLU-Pro
68.2%自己申告
General
MMLU-Redux
87.4%自己申告
MMMLU
86.7%自己申告
MBPP
0.81 / 100自己申告
LiveBench
77.1%自己申告
Include
73.5%自己申告
MultiLF
71.9%自己申告
BFCL
70.8%自己申告
MultiPL-E
65.9%自己申告
Language
BBH
88.9%自己申告
Math
GSM8k
94.4%自己申告
AIME 2024
85.7%自己申告
MGSM
83.5%自己申告
AIME 2025
81.5%自己申告
MATH
71.8%自己申告
Reasoning
CRUX-O
0.79 / 100自己申告
AA評価指数
Math Index23.7
Intelligence Index17.0
Coding Index14.0
Math 5000.9
Mmlu Pro0.8
Gpqa0.6
Ifbench0.4
Livecodebench0.3
Aime0.3
Scicode0.3
Tau20.3
Aime 250.2
Terminalbench Hard0.1
Hle0.0
Lcr0.0
LLM Statsカテゴリスコア
Writing100
Creativity100
Language80
Math80
Reasoning80
Tool Calling70
Code70
Finance70
General70
Healthcare70
Legal70
Biology50
Chemistry50
Physics50
Economics40
価格設定
入力価格$0.45 / 1M tokens
出力価格$1.8 / 1M tokens
混合価格(3:1)$0.787 / 1M tokens
速度
トークン/秒64.1 tokens/s
初トークン遅延1.24s
初回答遅延1.24s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません