Перейти к основному содержанию

Qwen3 235B A22B 2507 Instruct

AlibabaQwenОткрытые весаApache 2.0 · Коммерческое использование

Описание

Qwen3-235B-A22B-Instruct-2507 is the updated instruct version of Qwen3-235B-A22B featuring significant improvements in general capabilities including instruction following, logical reasoning, text comprehension, mathematics, science, coding and tool usage. It provides substantial gains in long-tail knowledge coverage across multiple languages and markedly better alignment with user preferences in subjective and open-ended tasks.

Дата выхода
2025-07-21
Параметры
235.0B
Длина контекста
262K
Модальности
text

Радар способностей

36
general
49
coding
76
reasoning
49
scienceоцен.
60
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Оценки бенчмарков (LLM Stats)

Agents

BFCL-v370.9%Сам.

Biology

GPQA77.5%Сам.

Chemistry

SuperGPQA62.6%Сам.

Code

Aider-Polyglot57.3%Сам.

Communication

WritingBench85.2%Сам.
Multi-IF77.5%Сам.
Tau2 Retail71.3%Сам.
Tau2 Airline44.0%Сам.

Creativity

Creative Writing v387.5%Сам.
Arena-Hard v279.2%Сам.

Factuality

SimpleQA54.3%Сам.

Finance

MMLU-Pro83.0%Сам.
MMLU-ProX79.4%Сам.

General

MMLU-Redux93.1%Сам.
IFEval88.7%Сам.
MultiPL-E87.9%Сам.
CSimpleQA84.3%Сам.
Include79.5%Сам.
LiveBench 2024112575.4%Сам.
LiveCodeBench v651.8%Сам.

Math

AIME 202570.3%Сам.
HMMT2555.4%Сам.
PolyMATH50.2%Сам.

Reasoning

ZebraLogic95.0%Сам.
ARC-AGI41.8%Сам.

Индексы оценки AA

Math Index
71.7
Intelligence Index
18.2
Math 500
1.0
Mmlu Pro
0.8
Gpqa
0.8
Aime
0.7
Aime 25
0.7
Livecodebench
0.5
Ifbench
0.5
Scicode
0.4
Tau2
0.3
Lcr
0.3
Terminalbench Hard
0.2
Hle
0.1

Оценки категорий LLM Stats

Instruction Following
80
Language
80
Legal
80
Structured Output
80
Finance
80
Healthcare
80
Biology
80
Creativity
80
Writing
80
Math
70
Physics
70
Reasoning
70
General
70
Agents
70
Chemistry
70
Communication
70
Code
60
Economics
60
Tool Calling
60
Multimodal
50
Spatial Reasoning
50
Factuality
50
Vision
50

Цены

Цена ввода$0.2 / 1M токенов
Цена вывода$0.825 / 1M токенов
Смешанная цена (3:1)$0.356 / 1M токенов

Скорость

Токенов/сек68.9
Задержка первого токена1.09s
Время до первого ответа1.09s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

23 провайдеров

Самый дешевый: CortecsСамый дорогой: Scaleway
ПровайдерВводВывод
1CortecsСамый дешевый
$0.062
$0.408
2SiliconFlow (China)
$0.09
$0.6
3NovitaAI
$0.09
$0.58
4Meganova
$0.09
$0.6
5LLM Gateway
$0.09
$0.58
6OpenRouter
$0.1
$0.1
7Weights & Biases
$0.1
$0.1
8IO.NET
$0.11
$0.6
9Chutes
$0.11
$0.6
10Kilo Gateway
$0.11
$0.6
11Abacus
$0.13
$0.6
12SiliconFlow
$0.13
$0.6
13Jiekou.AI
$0.15
$0.8
14Venice AI
$0.15
$0.75
15AlibabaОсновной
$0.2
$0.825
16submodel
$0.2
$0.6
17Nebius Token Factory
$0.2
$0.6
18Friendli
$0.2
$0.8
19302.AI
$0.29
$1.143
20NanoGPT
$0.3
$0.5
21Hugging Face
$0.3
$3
22Synthetic
$0.65
$3
23Scaleway
$0.75
$2.25

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки