Qwen3 235B A22B (Non-reasoning)
AlibabaQwenOpen WeightApache 2.0 · Commercial OK
설명
Qwen3 235B A22B is a large language model developed by Alibaba, featuring a Mixture-of-Experts (MoE) architecture with 235 billion total parameters and 22 billion activated parameters. It achieves competitive results in benchmark evaluations of coding, math, general capabilities, and more, compared to other top-tier models.
출시일
2025-04-28
파라미터
235.0B
컨텍스트 길이
131K
모달리티
text
능력 레이더
33
general
23
coding
40
reasoning
39
science추정
70
agents
0
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Code Ranking | 351 | 19.0 | AA |
| General Ranking | 286 | 38.0 | AA |
| Math Reasoning | 227 | 39.0 | AA |
| Reasoning | 32 | 79.0 | LS |
| Science | 275 | 40.0 | AA |
벤치마크 점수 (LLM Stats)
Biology
GPQA
47.5%자체 보고
Chemistry
SuperGPQA
44.1%자체 보고
Code
EvalPlus
0.78 / 100자체 보고
LiveCodeBench
70.7%자체 보고
Aider
61.8%자체 보고
Creativity
Arena Hard
95.6%자체 보고
Finance
MMLU
87.8%자체 보고
MMLU-Pro
68.2%자체 보고
General
MMLU-Redux
87.4%자체 보고
MMMLU
86.7%자체 보고
MBPP
0.81 / 100자체 보고
LiveBench
77.1%자체 보고
Include
73.5%자체 보고
MultiLF
71.9%자체 보고
BFCL
70.8%자체 보고
MultiPL-E
65.9%자체 보고
Language
BBH
88.9%자체 보고
Math
GSM8k
94.4%자체 보고
AIME 2024
85.7%자체 보고
MGSM
83.5%자체 보고
AIME 2025
81.5%자체 보고
MATH
71.8%자체 보고
Reasoning
CRUX-O
0.79 / 100자체 보고
AA 평가 지수
Math Index23.7
Intelligence Index17.0
Coding Index14.0
Math 5000.9
Mmlu Pro0.8
Gpqa0.6
Ifbench0.4
Livecodebench0.3
Aime0.3
Scicode0.3
Tau20.3
Aime 250.2
Terminalbench Hard0.1
Hle0.0
Lcr0.0
LLM Stats 카테고리 점수
Writing100
Creativity100
Language80
Math80
Reasoning80
Tool Calling70
Code70
Finance70
General70
Healthcare70
Legal70
Biology50
Chemistry50
Physics50
Economics40
가격
입력 가격$0.45 / 1M tokens
출력 가격$1.8 / 1M tokens
혼합 가격 (3:1)$0.787 / 1M tokens
속도
토큰/초64.1 tokens/s
첫 토큰 지연1.24s
첫 응답 지연1.24s
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다