Qwen3 235B A22B (Non-reasoning)
AlibabaQwenOpen WeightApache 2.0 · Commercial OK
Описание
Qwen3 235B A22B is a large language model developed by Alibaba, featuring a Mixture-of-Experts (MoE) architecture with 235 billion total parameters and 22 billion activated parameters. It achieves competitive results in benchmark evaluations of coding, math, general capabilities, and more, compared to other top-tier models.
Дата выхода
2025-04-28
Параметры
235.0B
Длина контекста
131K
Модальности
text
Радар способностей
33
general
23
coding
40
reasoning
39
scienceоцен.
70
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 351 | 19.0 | AA |
| General Ranking | 286 | 38.0 | AA |
| Math Reasoning | 227 | 39.0 | AA |
| Reasoning | 32 | 79.0 | LS |
| Science | 275 | 40.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
47.5%Сам.
Chemistry
SuperGPQA
44.1%Сам.
Code
EvalPlus
0.78 / 100Сам.
LiveCodeBench
70.7%Сам.
Aider
61.8%Сам.
Creativity
Arena Hard
95.6%Сам.
Finance
MMLU
87.8%Сам.
MMLU-Pro
68.2%Сам.
General
MMLU-Redux
87.4%Сам.
MMMLU
86.7%Сам.
MBPP
0.81 / 100Сам.
LiveBench
77.1%Сам.
Include
73.5%Сам.
MultiLF
71.9%Сам.
BFCL
70.8%Сам.
MultiPL-E
65.9%Сам.
Language
BBH
88.9%Сам.
Math
GSM8k
94.4%Сам.
AIME 2024
85.7%Сам.
MGSM
83.5%Сам.
AIME 2025
81.5%Сам.
MATH
71.8%Сам.
Reasoning
CRUX-O
0.79 / 100Сам.
Индексы оценки AA
Math Index23.7
Intelligence Index17.0
Coding Index14.0
Math 5000.9
Mmlu Pro0.8
Gpqa0.6
Ifbench0.4
Livecodebench0.3
Aime0.3
Scicode0.3
Tau20.3
Aime 250.2
Terminalbench Hard0.1
Hle0.0
Lcr0.0
Оценки категорий LLM Stats
Writing100
Creativity100
Language80
Math80
Reasoning80
Tool Calling70
Code70
Finance70
General70
Healthcare70
Legal70
Biology50
Chemistry50
Physics50
Economics40
Цены
Цена ввода$0.45 / 1M tokens
Цена вывода$1.8 / 1M tokens
Смешанная цена (3:1)$0.787 / 1M tokens
Скорость
Токенов/сек64.1 tokens/s
Задержка первого токена1.24s
Время до первого ответа1.24s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров