GLM-4.7-Flash (Non-reasoning)
Z AIGLMOpen WeightMIT · Commercial OK
Описание
GLM-4.7-Flash is a high-speed, cost-efficient variant of GLM-4.7 optimized for fast inference and lower latency. It retains the coding-centric capabilities of GLM-4.7 including thinking before acting, preserved reasoning across turns, and per-request thinking control for speed or accuracy trade-offs. Ideal for applications requiring quick responses while maintaining strong performance on coding, agentic workflows, and general reasoning tasks.
Дата выхода
2026-01-19
Параметры
30.0B
Длина контекста
203K
Модальности
text
Радар способностей
18
general
13
coding
45
reasoning
30
scienceоцен.
80
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Agents & Tools | 30 | 64.0 | LS |
| Code Ranking | 375 | 16.0 | AA |
| General Ranking | 195 | 51.0 | AA |
| Science | 354 | 31.0 | AA |
Оценки бенчмарков (LLM Stats)
Agents
Tau-bench
79.5%Сам.
BrowseComp
42.8%Сам.
Biology
GPQA
75.2%Сам.
Code
SWE-Bench Verified
59.2%Сам.
Math
AIME 2025
91.6%Сам.
Humanity's Last Exam
14.4%Сам.
Индексы оценки AA
Intelligence Index22.1
Coding Index11.0
Tau20.9
Ifbench0.5
Gpqa0.5
Scicode0.3
Lcr0.1
Hle0.0
Terminalbench Hard0.0
Оценки категорий LLM Stats
Tool Calling80
Biology80
Chemistry80
General80
Physics80
Agents60
Code60
Frontend Development60
Reasoning60
Math50
Search40
Vision10
Цены
Цена ввода$0.07 / 1M tokens
Цена вывода$0.4 / 1M tokens
Смешанная цена (3:1)$0.153 / 1M tokens
Скорость
Токенов/сек94.6 tokens/s
Задержка первого токена0.89s
Время до первого ответа0.89s
Доступные провайдеры
(Внутренние единицы LS)| Провайдер | Цена ввода | Цена вывода |
|---|---|---|
| ZAI | 70K | 400K |