Saltar al contenido principal

GLM-4.7-Flash (Non-reasoning)

Z AIGLMOpen WeightMIT · Commercial OK

Descripción

GLM-4.7-Flash is a high-speed, cost-efficient variant of GLM-4.7 optimized for fast inference and lower latency. It retains the coding-centric capabilities of GLM-4.7 including thinking before acting, preserved reasoning across turns, and per-request thinking control for speed or accuracy trade-offs. Ideal for applications requiring quick responses while maintaining strong performance on coding, agentic workflows, and general reasoning tasks.

Fecha de lanzamiento
2026-01-19
Parámetros
30.0B
Longitud del contexto
203K
Modalidades
text

Radar de capacidades

18
general
13
coding
45
reasoning
30
scienceest.
80
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Agents & Tools30
64.0
LS
Code Ranking375
16.0
AA
General Ranking195
51.0
AA
Science354
31.0
AA

Puntuaciones de benchmarks (LLM Stats)

Agents

Tau-bench79.5%Aut.
BrowseComp42.8%Aut.

Biology

GPQA75.2%Aut.

Code

SWE-Bench Verified59.2%Aut.

Math

AIME 202591.6%Aut.
Humanity's Last Exam14.4%Aut.

Índices de evaluación AA

Intelligence Index
22.1
Coding Index
11.0
Tau2
0.9
Ifbench
0.5
Gpqa
0.5
Scicode
0.3
Lcr
0.1
Hle
0.0
Terminalbench Hard
0.0

Puntuaciones por categoría LLM Stats

Tool Calling
80
Biology
80
Chemistry
80
General
80
Physics
80
Agents
60
Code
60
Frontend Development
60
Reasoning
60
Math
50
Search
40
Vision
10

Precios

Precio de entrada$0.07 / 1M tokens
Precio de salida$0.4 / 1M tokens
Precio mixto (3:1)$0.153 / 1M tokens

Velocidad

Tokens/seg94.6 tokens/s
Retraso del primer token0.89s
Tiempo hasta la respuesta0.89s

Proveedores disponibles

(Unidades internas LS)
ProveedorPrecio de entradaPrecio de salida
ZAI70K400K

Fuentes externas