GLM-4.7-Flash (Non-reasoning)
Z AIGLMOpen WeightMIT · Commercial OK
Description
GLM-4.7-Flash is a high-speed, cost-efficient variant of GLM-4.7 optimized for fast inference and lower latency. It retains the coding-centric capabilities of GLM-4.7 including thinking before acting, preserved reasoning across turns, and per-request thinking control for speed or accuracy trade-offs. Ideal for applications requiring quick responses while maintaining strong performance on coding, agentic workflows, and general reasoning tasks.
Date de sortie
2026-01-19
Paramètres
30.0B
Longueur du contexte
203K
Modalités
text
Radar de capacités
18
general
13
coding
45
reasoning
30
scienceest.
80
agents
0
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Agents & Tools | 30 | 64.0 | LS |
| Code Ranking | 375 | 16.0 | AA |
| General Ranking | 195 | 51.0 | AA |
| Science | 354 | 31.0 | AA |
Scores de benchmarks (LLM Stats)
Agents
Tau-bench
79.5%Aut.
BrowseComp
42.8%Aut.
Biology
GPQA
75.2%Aut.
Code
SWE-Bench Verified
59.2%Aut.
Math
AIME 2025
91.6%Aut.
Humanity's Last Exam
14.4%Aut.
Indices d'évaluation AA
Intelligence Index22.1
Coding Index11.0
Tau20.9
Ifbench0.5
Gpqa0.5
Scicode0.3
Lcr0.1
Hle0.0
Terminalbench Hard0.0
Scores par catégorie LLM Stats
Tool Calling80
Biology80
Chemistry80
General80
Physics80
Agents60
Code60
Frontend Development60
Reasoning60
Math50
Search40
Vision10
Tarification
Prix d'entrée$0.07 / 1M tokens
Prix de sortie$0.4 / 1M tokens
Prix mixte (3:1)$0.153 / 1M tokens
Vitesse
Tokens/sec94.6 tokens/s
Délai du premier token0.89s
Temps de réponse0.89s
Fournisseurs disponibles
(Unités internes LS)| Fournisseur | Prix d'entrée | Prix de sortie |
|---|---|---|
| ZAI | 70K | 400K |