GLM-5.1 (Reasoning)

Z AIGLMОткрытые весаMIT · Коммерческое использование

Описание

GLM-5.1 is Z.AI's next-generation flagship foundation model designed for long-horizon agentic engineering tasks. Built on a 754B MoE architecture (40B active parameters), it can work continuously and autonomously on a single task for up to 8 hours, completing the full loop from planning and execution to iterative optimization and delivery. GLM-5.1 achieves state-of-the-art on SWE-Bench Pro (58.4) and demonstrates strong performance across coding, reasoning, and agentic benchmarks. It supports 200K context length, 128K max output tokens, thinking mode, function calling, structured output, context caching, and MCP integration. Overall performance is aligned with Claude Opus 4.6 with particular strengths in sustained execution and complex engineering optimization.

Дата выхода

2026-04-07

Параметры

754.0B

Длина контекста

200K

Модальности

text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Агентные возможности	33	60.0	LS
Рейтинг кодинга	60	74.0	AA
Общий рейтинг	21	81.0	AA
Наука	43	72.0	AA

Оценки бенчмарков (LLM Stats)

Agents

Vending-Bench 2

563441.0%Сам.

GDPval-AA

1281.00 / 3000Сам.

BrowseComp

79.3%Сам.

MCP Atlas

71.8%Сам.

TAU3-Bench

70.6%Сам.

Terminal-Bench 2.0

69.0%Сам.

CyberGym

68.7%Сам.

SWE-Bench Pro

58.4%Сам.

Finance Agent v2

44.8%Сам.

NL2Repo

42.7%Сам.

Toolathlon

40.7%Сам.

FrontierSWE

31.0%Сам.

Biology

GPQA

86.2%Сам.

General

LiveBench

70.2%Сам.

Math

AIME 2026

95.3%Сам.

HMMT 2025

94.0%Сам.

IMO-AnswerBench

83.8%Сам.

HMMT Feb 26

82.6%Сам.

Humanity's Last Exam

52.3%Сам.

Индексы оценки AA

Coding Index

55.8

Intelligence Index

40.2

Tau2

1.0

Gpqa

0.9

Ifbench

0.8

Lcr

0.6

Terminalbench V2 1

0.6

Scicode

0.4

Terminalbench Hard

0.4

Hle

0.3

Tau Banking

0.1

Оценки категорий LLM Stats

Legal

100

Finance

100

Agents

100

Reasoning

100

General

100

Physics

Biology

Chemistry

Math

Safety

Code

Tool Calling

Vision

Coding

Цены

Цена ввода$1.4 / 1M токенов

Цена вывода$4.4 / 1M токенов

Смешанная цена (3:1)$2.15 / 1M токенов

Цена чтения кэша$0.26 / 1M токенов

Цена записи кэшаБесплатно

Скорость

Токенов/сек99.8

Задержка первого токена0.80s

Время до первого ответа38.80s

Рейтинг цен провайдеров

25 провайдеров

Самый дешевый: ZAIСамый дорогой: Merge Gateway

ПровайдерВводВывод

1ZAIСамый дешевый

2FriendliAI

3NanoGPT

$0.3

$2.55

4HPC-AI

$0.615

$2.46

5ZenMux

$0.8781

$3.5126

6Lilac

$0.9

7OpenRouter

$0.98

$3.08

8Hugging Face

$3.2

9Wafer

$3.2

10Synthetic

11routing.run

12Deep Infra

$1.05

$3.5

13FastRouter

$1.05

$3.5

14Kilo Gateway

$1.26

$3.96

15Baseten

$1.3

$4.3

16Z AIОсновной

$1.4

$4.4

17SiliconFlow (China)

$1.4

$4.4

18NovitaAI

$1.4

$4.4

19Weights & Biases

$1.4

$4.4

20Friendli

$1.4

$4.4

21SiliconFlow

$1.4

$4.4

22Vercel AI Gateway

$1.4

$4.4

23Together AI

$1.4

$4.4

24OrcaRouter

$1.4

$4.4

25Merge Gateway

$1.4

$4.4

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis