Перейти к основному содержанию

GLM-4.5 (Reasoning)

Z AIGLMOpen WeightMIT · Commercial OK

Описание

GLM-4.5 is an Agentic, Reasoning, and Coding (ARC) foundation model designed for intelligent agents, featuring 355 billion total parameters with 32 billion active parameters using MoE architecture. Trained on 23T tokens through multi-stage training, it is a hybrid reasoning model that provides two modes: thinking mode for complex reasoning and tool usage, and non-thinking mode for immediate responses. The model unifies agentic, reasoning, and coding capabilities with 128K context length support. It achieves exceptional performance with a score of 63.2 across 12 industry-standard benchmarks, placing 3rd among all proprietary and open-source models. Released under MIT open-source license allowing commercial use and secondary development.

Дата выхода
2025-07-28
Параметры
355.0B
Длина контекста
131K
Модальности
text

Радар способностей

41
general
44
coding
81
reasoning
50
scienceоцен.
70
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Agents & Tools58
55.0
LS
Code Ranking125
54.0
AA
General Ranking187
52.0
AA
Math Reasoning76
82.0
AA
Science141
55.0
AA

Оценки бенчмарков (LLM Stats)

Agents

BFCL-v377.8%Сам.
Terminal-Bench37.5%Сам.
BrowseComp26.4%Сам.

Biology

GPQA79.1%Сам.
SciCode41.7%Сам.

Code

LiveCodeBench72.9%Сам.
SWE-Bench Verified64.2%Сам.

Communication

TAU-bench Retail79.7%Сам.
TAU-bench Airline60.4%Сам.

Finance

MMLU-Pro84.6%Сам.

General

AA-Index67.7%Сам.

Math

MATH-50098.2%Сам.
AIME 202491.0%Сам.
Humanity's Last Exam14.4%Сам.

Индексы оценки AA

Math Index
73.7
Intelligence Index
26.4
Coding Index
26.3
Math 500
1.0
Aime
0.9
Mmlu Pro
0.8
Gpqa
0.8
Livecodebench
0.7
Aime 25
0.7
Lcr
0.5
Ifbench
0.4
Tau2
0.4
Scicode
0.3
Terminalbench Hard
0.2
Hle
0.1

Оценки категорий LLM Stats

Structured Output
80
Finance
80
General
80
Healthcare
80
Language
80
Legal
80
Tool Calling
70
Communication
70
Math
70
Biology
60
Chemistry
60
Frontend Development
60
Physics
60
Reasoning
60
Agents
50
Code
50
Search
30
Vision
10

Цены

Цена ввода$0.6 / 1M tokens
Цена вывода$2.2 / 1M tokens
Смешанная цена (3:1)$1 / 1M tokens

Скорость

Токенов/сек42.4 tokens/s
Задержка первого токена1.03s
Время до первого ответа48.20s

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки