Saltar al contenido principal

Qwen3 235B A22B (Non-reasoning)

AlibabaQwenOpen WeightApache 2.0 · Commercial OK

Descripción

Qwen3 235B A22B is a large language model developed by Alibaba, featuring a Mixture-of-Experts (MoE) architecture with 235 billion total parameters and 22 billion activated parameters. It achieves competitive results in benchmark evaluations of coding, math, general capabilities, and more, compared to other top-tier models.

Fecha de lanzamiento
2025-04-28
Parámetros
235.0B
Longitud del contexto
131K
Modalidades
text

Radar de capacidades

33
general
23
coding
40
reasoning
39
scienceest.
70
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Code Ranking351
19.0
AA
General Ranking286
38.0
AA
Math Reasoning227
39.0
AA
Reasoning32
79.0
LS
Science275
40.0
AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA47.5%Aut.

Chemistry

SuperGPQA44.1%Aut.

Code

EvalPlus0.78 / 100Aut.
LiveCodeBench70.7%Aut.
Aider61.8%Aut.

Creativity

Arena Hard95.6%Aut.

Finance

MMLU87.8%Aut.
MMLU-Pro68.2%Aut.

General

MMLU-Redux87.4%Aut.
MMMLU86.7%Aut.
MBPP0.81 / 100Aut.
LiveBench77.1%Aut.
Include73.5%Aut.
MultiLF71.9%Aut.
BFCL70.8%Aut.
MultiPL-E65.9%Aut.

Language

BBH88.9%Aut.

Math

GSM8k94.4%Aut.
AIME 202485.7%Aut.
MGSM83.5%Aut.
AIME 202581.5%Aut.
MATH71.8%Aut.

Reasoning

CRUX-O0.79 / 100Aut.

Índices de evaluación AA

Math Index
23.7
Intelligence Index
17.0
Coding Index
14.0
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.6
Ifbench
0.4
Livecodebench
0.3
Aime
0.3
Scicode
0.3
Tau2
0.3
Aime 25
0.2
Terminalbench Hard
0.1
Hle
0.0
Lcr
0.0

Puntuaciones por categoría LLM Stats

Writing
100
Creativity
100
Language
80
Math
80
Reasoning
80
Tool Calling
70
Code
70
Finance
70
General
70
Healthcare
70
Legal
70
Biology
50
Chemistry
50
Physics
50
Economics
40

Precios

Precio de entrada$0.45 / 1M tokens
Precio de salida$1.8 / 1M tokens
Precio mixto (3:1)$0.787 / 1M tokens

Velocidad

Tokens/seg64.1 tokens/s
Retraso del primer token1.24s
Tiempo hasta la respuesta1.24s

Proveedores disponibles

(Unidades internas LS)

No hay datos de proveedores disponibles

Fuentes externas