Passer au contenu principal

GLM-4.7-Flash (Non-reasoning)

Z AIGLMOpen WeightMIT · Commercial OK

Description

GLM-4.7-Flash is a high-speed, cost-efficient variant of GLM-4.7 optimized for fast inference and lower latency. It retains the coding-centric capabilities of GLM-4.7 including thinking before acting, preserved reasoning across turns, and per-request thinking control for speed or accuracy trade-offs. Ideal for applications requiring quick responses while maintaining strong performance on coding, agentic workflows, and general reasoning tasks.

Date de sortie
2026-01-19
Paramètres
30.0B
Longueur du contexte
203K
Modalités
text

Radar de capacités

18
general
13
coding
45
reasoning
30
scienceest.
80
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Agents & Tools30
64.0
LS
Code Ranking375
16.0
AA
General Ranking195
51.0
AA
Science354
31.0
AA

Scores de benchmarks (LLM Stats)

Agents

Tau-bench79.5%Aut.
BrowseComp42.8%Aut.

Biology

GPQA75.2%Aut.

Code

SWE-Bench Verified59.2%Aut.

Math

AIME 202591.6%Aut.
Humanity's Last Exam14.4%Aut.

Indices d'évaluation AA

Intelligence Index
22.1
Coding Index
11.0
Tau2
0.9
Ifbench
0.5
Gpqa
0.5
Scicode
0.3
Lcr
0.1
Hle
0.0
Terminalbench Hard
0.0

Scores par catégorie LLM Stats

Tool Calling
80
Biology
80
Chemistry
80
General
80
Physics
80
Agents
60
Code
60
Frontend Development
60
Reasoning
60
Math
50
Search
40
Vision
10

Tarification

Prix d'entrée$0.07 / 1M tokens
Prix de sortie$0.4 / 1M tokens
Prix mixte (3:1)$0.153 / 1M tokens

Vitesse

Tokens/sec94.6 tokens/s
Délai du premier token0.89s
Temps de réponse0.89s

Fournisseurs disponibles

(Unités internes LS)
FournisseurPrix d'entréePrix de sortie
ZAI70K400K

Sources externes