Перейти к основному содержанию

GLM-5.1 (Reasoning)

Z AIGLMOpen WeightMIT · Commercial OK

Описание

GLM-5.1 is Z.AI's next-generation flagship foundation model designed for long-horizon agentic engineering tasks. Built on a 754B MoE architecture (40B active parameters), it can work continuously and autonomously on a single task for up to 8 hours, completing the full loop from planning and execution to iterative optimization and delivery. GLM-5.1 achieves state-of-the-art on SWE-Bench Pro (58.4) and demonstrates strong performance across coding, reasoning, and agentic benchmarks. It supports 200K context length, 128K max output tokens, thinking mode, function calling, structured output, context caching, and MCP integration. Overall performance is aligned with Claude Opus 4.6 with particular strengths in sustained execution and complex engineering optimization.

Дата выхода
2026-04-07
Параметры
754.0B
Длина контекста
203K
Модальности
text

Радар способностей

46
general
43
coding
87
reasoning
60
scienceоцен.
60
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Agents & Tools21
67.0
LS
Code Ranking40
75.0
AA
General Ranking9
90.0
AA
Science33
76.0
AA

Оценки бенчмарков (LLM Stats)

Agents

Vending-Bench 2563441.0%Сам.
BrowseComp79.3%Сам.
MCP Atlas71.8%Сам.
TAU3-Bench70.6%Сам.
Terminal-Bench 2.069.0%Сам.
CyberGym68.7%Сам.
SWE-Bench Pro58.4%Сам.
NL2Repo42.7%Сам.
Toolathlon40.7%Сам.

Biology

GPQA86.2%Сам.

Math

AIME 202695.3%Сам.
HMMT 202594.0%Сам.
IMO-AnswerBench83.8%Сам.
HMMT Feb 2682.6%Сам.
Humanity's Last Exam52.3%Сам.

Индексы оценки AA

Intelligence Index
51.4
Coding Index
43.4
Tau2
1.0
Gpqa
0.9
Ifbench
0.8
Lcr
0.6
Scicode
0.4
Terminalbench Hard
0.4
Hle
0.3

Оценки категорий LLM Stats

Agents
100
Reasoning
100
Biology
90
Chemistry
90
General
90
Physics
90
Math
80
Search
80
Code
70
Safety
70
Tool Calling
60
Vision
50
Coding
40

Цены

Цена ввода$1.4 / 1M tokens
Цена вывода$4.4 / 1M tokens
Смешанная цена (3:1)$2.15 / 1M tokens

Скорость

Токенов/сек53.8 tokens/s
Задержка первого токена1.04s
Время до первого ответа71.55s

Доступные провайдеры

(Внутренние единицы LS)
ПровайдерЦена вводаЦена вывода
ZAI1.4M4.4M

Внешние ссылки