GLM-4.6 (Reasoning)
Z AIGLMOpen WeightMIT · Commercial OK
Описание
GLM-4.6 is the latest version of Z.ai's flagship model, bringing significant improvements over GLM-4.5. Key features include: 200K token context window (expanded from 128K), superior coding performance with better real-world application in Claude Code/Cline/Roo Code/Kilo Code, advanced reasoning with tool use during inference, stronger agent capabilities, and refined writing aligned with human preferences. GLM-4.6 achieves competitive performance with DeepSeek-V3.2-Exp and Claude Sonnet 4, reaching near parity with Claude Sonnet 4 (48.6% win rate) on CC-Bench real-world coding tasks.
Дата выхода
2025-09-30
Параметры
357.0B
Длина контекста
205K
Модальности
image, text, video
Радар способностей
45
general
44
coding
85
reasoning
51
scienceоцен.
40
agents
20
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Agents & Tools | 84 | 43.0 | LS |
| Code Ranking | 111 | 58.0 | AA |
| General Ranking | 135 | 61.0 | AA |
| Math Reasoning | 54 | 87.0 | AA |
| Science | 122 | 58.0 | AA |
Оценки бенчмарков (LLM Stats)
Agents
BrowseComp
45.1%Сам.
Terminal-Bench
40.5%Сам.
Biology
GPQA
81.0%Сам.
Code
SWE-Bench Verified
68.0%Сам.
General
LiveCodeBench v6
82.8%Сам.
Math
AIME 2025
93.9%Сам.
Humanity's Last Exam
17.2%Сам.
Индексы оценки AA
Math Index86.0
Intelligence Index32.5
Coding Index29.5
Aime 250.9
Mmlu Pro0.8
Gpqa0.8
Tau20.7
Livecodebench0.7
Lcr0.5
Ifbench0.4
Scicode0.4
Terminalbench Hard0.3
Hle0.1
Оценки категорий LLM Stats
Biology80
Chemistry80
General80
Physics80
Frontend Development70
Math60
Reasoning60
Code50
Search50
Agents40
Vision20
Цены
Цена ввода$0.55 / 1M tokens
Цена вывода$2.2 / 1M tokens
Смешанная цена (3:1)$0.963 / 1M tokens
Скорость
Токенов/сек37.2 tokens/s
Задержка первого токена0.82s
Время до первого ответа54.62s
Доступные провайдеры
(Внутренние единицы LS)| Провайдер | Цена ввода | Цена вывода |
|---|---|---|
| Fireworks | 550K | 2.2M |
| DeepInfra | 600K | 2.0M |