Qwen3 235B A22B 2507 Instruct

AlibabaQwenОткрытые весаApache 2.0 · Коммерческое использование

Описание

Qwen3-235B-A22B-Instruct-2507 is the updated instruct version of Qwen3-235B-A22B featuring significant improvements in general capabilities including instruction following, logical reasoning, text comprehension, mathematics, science, coding and tool usage. It provides substantial gains in long-tail knowledge coverage across multiple languages and markedly better alignment with user preferences in subjective and open-ended tasks.

Дата выхода

2025-07-21

Параметры

235.0B

Длина контекста

262K

Модальности

text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Агентные возможности	11	71.0	LS
Рейтинг кодинга	235	41.0	AA
Общий рейтинг	229	46.0	AA
Математическое мышление	96	78.0	AA
Рассуждения	80	55.0	LS
Наука	172	52.0	AA

Оценки бенчмарков (LLM Stats)

Agents

BFCL-v3

70.9%Сам.

Biology

GPQA

77.5%Сам.

Chemistry

SuperGPQA

62.6%Сам.

Code

Aider-Polyglot

57.3%Сам.

Communication

WritingBench

85.2%Сам.

Multi-IF

77.5%Сам.

Tau2 Retail

71.3%Сам.

Tau2 Airline

44.0%Сам.

Creativity

Creative Writing v3

87.5%Сам.

Arena-Hard v2

79.2%Сам.

Factuality

SimpleQA

54.3%Сам.

Finance

MMLU-Pro

83.0%Сам.

MMLU-ProX

79.4%Сам.

General

MMLU-Redux

93.1%Сам.

IFEval

88.7%Сам.

MultiPL-E

87.9%Сам.

CSimpleQA

84.3%Сам.

Include

79.5%Сам.

LiveBench 20241125

75.4%Сам.

LiveCodeBench v6

51.8%Сам.

Math

AIME 2025

70.3%Сам.

HMMT25

55.4%Сам.

PolyMATH

50.2%Сам.

Reasoning

ZebraLogic

95.0%Сам.

ARC-AGI

41.8%Сам.

Индексы оценки AA

Math Index

71.7

Intelligence Index

18.2

Math 500

1.0

Mmlu Pro

0.8

Gpqa

0.8

Aime

0.7

Aime 25

0.7

Livecodebench

0.5

Ifbench

0.5

Scicode

0.4

Tau2

0.3

Lcr

0.3

Terminalbench Hard

0.2

Hle

0.1

Оценки категорий LLM Stats

Instruction Following

Language

Legal

Structured Output

Finance

Healthcare

Biology

Creativity

Writing

Math

Physics

Reasoning

General

Agents

Chemistry

Communication

Code

Economics

Tool Calling

Multimodal

Spatial Reasoning

Factuality

Vision

Цены

Цена ввода$0.2 / 1M токенов

Цена вывода$0.825 / 1M токенов

Смешанная цена (3:1)$0.356 / 1M токенов

Скорость

Токенов/сек68.9

Задержка первого токена1.09s

Время до первого ответа1.09s

Рейтинг цен провайдеров

23 провайдеров

Самый дешевый: CortecsСамый дорогой: Scaleway

ПровайдерВводВывод

1CortecsСамый дешевый

$0.062

$0.408

2SiliconFlow (China)

$0.09

$0.6

3NovitaAI

$0.09

$0.58

4Meganova

$0.09

$0.6

5LLM Gateway

$0.09

$0.58

6OpenRouter

$0.1

7Weights & Biases

$0.1

8IO.NET

$0.11

$0.6

9Chutes

$0.11

$0.6

10Kilo Gateway

$0.11

$0.6

11Abacus

$0.13

$0.6

12SiliconFlow

$0.13

$0.6

13Jiekou.AI

$0.15

$0.8

14Venice AI

$0.15

$0.75

15AlibabaОсновной

$0.2

$0.825

16submodel

$0.2

$0.6

17Nebius Token Factory

$0.2

$0.6

18Friendli

$0.2

$0.8

19302.AI

$0.29

$1.143

20NanoGPT

$0.3

$0.5

21Hugging Face

$0.3

22Synthetic

$0.65

23Scaleway

$0.75

$2.25

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis