Перейти к основному содержанию

Qwen3 235B A22B 2507 Instruct

AlibabaQwenOpen WeightApache 2.0 · Commercial OK

Описание

Qwen3-235B-A22B-Instruct-2507 is the updated instruct version of Qwen3-235B-A22B featuring significant improvements in general capabilities including instruction following, logical reasoning, text comprehension, mathematics, science, coding and tool usage. It provides substantial gains in long-tail knowledge coverage across multiple languages and markedly better alignment with user preferences in subjective and open-ended tasks.

Дата выхода
2025-07-21
Параметры
235.0B
Длина контекста
262K
Модальности
text

Радар способностей

40
general
34
coding
76
reasoning
49
scienceоцен.
60
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Agents & Tools13
71.0
LS
Code Ranking218
39.0
AA
General Ranking204
50.0
AA
Math Reasoning96
78.0
AA
Reasoning75
55.0
LS
Science149
54.0
AA

Оценки бенчмарков (LLM Stats)

Agents

BFCL-v370.9%Сам.

Biology

GPQA77.5%Сам.

Chemistry

SuperGPQA62.6%Сам.

Code

Aider-Polyglot57.3%Сам.

Communication

WritingBench85.2%Сам.
Multi-IF77.5%Сам.
Tau2 Retail71.3%Сам.
Tau2 Airline44.0%Сам.

Creativity

Creative Writing v387.5%Сам.
Arena-Hard v279.2%Сам.

Factuality

SimpleQA54.3%Сам.

Finance

MMLU-Pro83.0%Сам.
MMLU-ProX79.4%Сам.

General

MMLU-Redux93.1%Сам.
IFEval88.7%Сам.
MultiPL-E87.9%Сам.
CSimpleQA84.3%Сам.
Include79.5%Сам.
LiveBench 2024112575.4%Сам.
LiveCodeBench v651.8%Сам.

Math

AIME 202570.3%Сам.
HMMT2555.4%Сам.
PolyMATH50.2%Сам.

Reasoning

ZebraLogic95.0%Сам.
ARC-AGI41.8%Сам.

Индексы оценки AA

Math Index
71.7
Intelligence Index
25.0
Coding Index
22.1
Math 500
1.0
Mmlu Pro
0.8
Gpqa
0.8
Aime
0.7
Aime 25
0.7
Livecodebench
0.5
Ifbench
0.5
Scicode
0.4
Tau2
0.3
Lcr
0.3
Terminalbench Hard
0.2
Hle
0.1

Оценки категорий LLM Stats

Structured Output
80
Writing
80
Biology
80
Creativity
80
Finance
80
Healthcare
80
Instruction Following
80
Language
80
Legal
80
Agents
70
Chemistry
70
Communication
70
General
70
Math
70
Physics
70
Reasoning
70
Tool Calling
60
Code
60
Economics
60
Spatial Reasoning
50
Vision
50
Factuality
50
Multimodal
50

Цены

Цена ввода$0.2 / 1M tokens
Цена вывода$0.825 / 1M tokens
Смешанная цена (3:1)$0.356 / 1M tokens

Скорость

Токенов/сек67.8 tokens/s
Задержка первого токена1.17s
Время до первого ответа1.17s

Доступные провайдеры

(Внутренние единицы LS)
ПровайдерЦена вводаЦена вывода
Fireworks150K800K

Внешние ссылки