메인 콘텐츠로 건너뛰기

Qwen3 235B A22B (Non-reasoning)

AlibabaQwenOpen WeightApache 2.0 · Commercial OK

설명

Qwen3 235B A22B is a large language model developed by Alibaba, featuring a Mixture-of-Experts (MoE) architecture with 235 billion total parameters and 22 billion activated parameters. It achieves competitive results in benchmark evaluations of coding, math, general capabilities, and more, compared to other top-tier models.

출시일
2025-04-28
파라미터
235.0B
컨텍스트 길이
131K
모달리티
text

능력 레이더

33
general
23
coding
40
reasoning
39
science추정
70
agents
0
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
Code Ranking351
19.0
AA
General Ranking286
38.0
AA
Math Reasoning227
39.0
AA
Reasoning32
79.0
LS
Science275
40.0
AA

벤치마크 점수 (LLM Stats)

Biology

GPQA47.5%자체 보고

Chemistry

SuperGPQA44.1%자체 보고

Code

EvalPlus0.78 / 100자체 보고
LiveCodeBench70.7%자체 보고
Aider61.8%자체 보고

Creativity

Arena Hard95.6%자체 보고

Finance

MMLU87.8%자체 보고
MMLU-Pro68.2%자체 보고

General

MMLU-Redux87.4%자체 보고
MMMLU86.7%자체 보고
MBPP0.81 / 100자체 보고
LiveBench77.1%자체 보고
Include73.5%자체 보고
MultiLF71.9%자체 보고
BFCL70.8%자체 보고
MultiPL-E65.9%자체 보고

Language

BBH88.9%자체 보고

Math

GSM8k94.4%자체 보고
AIME 202485.7%자체 보고
MGSM83.5%자체 보고
AIME 202581.5%자체 보고
MATH71.8%자체 보고

Reasoning

CRUX-O0.79 / 100자체 보고

AA 평가 지수

Math Index
23.7
Intelligence Index
17.0
Coding Index
14.0
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.6
Ifbench
0.4
Livecodebench
0.3
Aime
0.3
Scicode
0.3
Tau2
0.3
Aime 25
0.2
Terminalbench Hard
0.1
Hle
0.0
Lcr
0.0

LLM Stats 카테고리 점수

Writing
100
Creativity
100
Language
80
Math
80
Reasoning
80
Tool Calling
70
Code
70
Finance
70
General
70
Healthcare
70
Legal
70
Biology
50
Chemistry
50
Physics
50
Economics
40

가격

입력 가격$0.45 / 1M tokens
출력 가격$1.8 / 1M tokens
혼합 가격 (3:1)$0.787 / 1M tokens

속도

토큰/초64.1 tokens/s
첫 토큰 지연1.24s
첫 응답 지연1.24s

사용 가능한 프로바이더

(LS 내부 단위)

프로바이더 데이터가 없습니다

외부 링크