Перейти к основному содержанию

GLM-5.1 (Reasoning)

Z AIGLMОткрытые весаMIT · Коммерческое использование

Описание

GLM-5.1 is Z.AI's next-generation flagship foundation model designed for long-horizon agentic engineering tasks. Built on a 754B MoE architecture (40B active parameters), it can work continuously and autonomously on a single task for up to 8 hours, completing the full loop from planning and execution to iterative optimization and delivery. GLM-5.1 achieves state-of-the-art on SWE-Bench Pro (58.4) and demonstrates strong performance across coding, reasoning, and agentic benchmarks. It supports 200K context length, 128K max output tokens, thinking mode, function calling, structured output, context caching, and MCP integration. Overall performance is aligned with Claude Opus 4.6 with particular strengths in sustained execution and complex engineering optimization.

Дата выхода
2026-04-07
Параметры
754.0B
Длина контекста
200K
Модальности
text

Радар способностей

38
general
54
coding
87
reasoning
60
scienceоцен.
60
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Агентные возможности33
60.0
LS
Рейтинг кодинга60
74.0
AA
Общий рейтинг21
81.0
AA
Наука43
72.0
AA

Оценки бенчмарков (LLM Stats)

Agents

Vending-Bench 2563441.0%Сам.
GDPval-AA1281.00 / 3000Сам.
BrowseComp79.3%Сам.
MCP Atlas71.8%Сам.
TAU3-Bench70.6%Сам.
Terminal-Bench 2.069.0%Сам.
CyberGym68.7%Сам.
SWE-Bench Pro58.4%Сам.
Finance Agent v244.8%Сам.
NL2Repo42.7%Сам.
Toolathlon40.7%Сам.
FrontierSWE31.0%Сам.

Biology

GPQA86.2%Сам.

General

LiveBench70.2%Сам.

Math

AIME 202695.3%Сам.
HMMT 202594.0%Сам.
IMO-AnswerBench83.8%Сам.
HMMT Feb 2682.6%Сам.
Humanity's Last Exam52.3%Сам.

Индексы оценки AA

Coding Index
55.8
Intelligence Index
40.2
Tau2
1.0
Gpqa
0.9
Ifbench
0.8
Lcr
0.6
Terminalbench V2 1
0.6
Scicode
0.4
Terminalbench Hard
0.4
Hle
0.3
Tau Banking
0.1

Оценки категорий LLM Stats

Legal
100
Finance
100
Agents
100
Reasoning
100
General
100
Physics
90
Biology
90
Chemistry
90
Math
80
Search
80
Safety
70
Code
60
Tool Calling
60
Vision
50
Coding
40

Цены

Цена ввода$1.4 / 1M токенов
Цена вывода$4.4 / 1M токенов
Смешанная цена (3:1)$2.15 / 1M токенов
Цена чтения кэша$0.26 / 1M токенов
Цена записи кэшаБесплатно

Скорость

Токенов/сек99.8
Задержка первого токена0.80s
Время до первого ответа38.80s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

25 провайдеров

Самый дешевый: ZAIСамый дорогой: Merge Gateway
ПровайдерВводВывод
1ZAIСамый дешевый
$0
$0
2FriendliAI
$0
$0
3NanoGPT
$0.3
$2.55
4HPC-AI
$0.615
$2.46
5ZenMux
$0.8781
$3.5126
6Lilac
$0.9
$3
7OpenRouter
$0.98
$3.08
8Hugging Face
$1
$3.2
9Wafer
$1
$3.2
10Synthetic
$1
$3
11routing.run
$1
$3
12Deep Infra
$1.05
$3.5
13FastRouter
$1.05
$3.5
14Kilo Gateway
$1.26
$3.96
15Baseten
$1.3
$4.3
16Z AIОсновной
$1.4
$4.4
17SiliconFlow (China)
$1.4
$4.4
18NovitaAI
$1.4
$4.4
19Weights & Biases
$1.4
$4.4
20Friendli
$1.4
$4.4
21SiliconFlow
$1.4
$4.4
22Vercel AI Gateway
$1.4
$4.4
23Together AI
$1.4
$4.4
24OrcaRouter
$1.4
$4.4
25Merge Gateway
$1.4
$4.4

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки