GLM-4.7 (Reasoning)
Z AIGLMOpen WeightMIT · Commercial OK
説明
GLM 4.7 is a coding‑centric model that thinks before acting, preserves its reasoning across turns, and lets you control thinking per request for speed or accuracy. It upgrades agentic workflows with stronger multi‑step tool use, better terminal and multilingual coding, and a noticeable jump in UI output quality for modern, clean webpages and slides. You can use it in popular coding agents, call it via the Z.ai API, and even run it locally with public weights on HuggingFace and ModelScope using vLLM or SGLang.
リリース日
2025-12-22
パラメータ
358.0B
コンテキスト長
203K
モダリティ
text
能力レーダー
53
general
56
coding
93
reasoning
59
science推定
60
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 59 | 55.0 | LS |
| Code Ranking | 57 | 71.0 | AA |
| General Ranking | 39 | 81.0 | AA |
| Math Reasoning | 13 | 96.0 | AA |
| Reasoning | 55 | 67.0 | LS |
| Science | 44 | 74.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
Tau-bench
87.4%自己申告
BrowseComp
52.0%自己申告
Terminal-Bench 2.0
41.0%自己申告
Terminal-Bench
33.3%自己申告
Biology
GPQA
85.7%自己申告
Code
SWE-Bench Verified
73.8%自己申告
SWE-bench Multilingual
66.7%自己申告
Finance
MMLU-Pro
84.3%自己申告
General
LiveCodeBench v6
84.9%自己申告
Math
AIME 2025
95.7%自己申告
IMO-AnswerBench
82.0%自己申告
Humanity's Last Exam
42.8%自己申告
Reasoning
BrowseComp-zh
66.6%自己申告
AA評価指数
Math Index95.0
Intelligence Index42.1
Coding Index36.3
Tau21.0
Aime 250.9
Livecodebench0.9
Gpqa0.9
Mmlu Pro0.9
Ifbench0.7
Lcr0.6
Scicode0.5
Terminalbench Hard0.3
Hle0.3
LLM Statsカテゴリスコア
Biology90
Chemistry90
General90
Physics90
Finance80
Healthcare80
Language80
Legal80
Math80
Frontend Development70
Reasoning70
Tool Calling60
Search60
Agents50
Code50
Vision40
価格設定
入力価格$0.6 / 1M tokens
出力価格$2.2 / 1M tokens
混合価格(3:1)$1 / 1M tokens
速度
トークン/秒91.5 tokens/s
初トークン遅延0.90s
初回答遅延22.74s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| Novita | 600K | 2.2M |
| Fireworks | 600K | 2.2M |