GLM-4.6 (Reasoning)
Z AIGLMOpen WeightMIT · Commercial OK
説明
GLM-4.6 is the latest version of Z.ai's flagship model, bringing significant improvements over GLM-4.5. Key features include: 200K token context window (expanded from 128K), superior coding performance with better real-world application in Claude Code/Cline/Roo Code/Kilo Code, advanced reasoning with tool use during inference, stronger agent capabilities, and refined writing aligned with human preferences. GLM-4.6 achieves competitive performance with DeepSeek-V3.2-Exp and Claude Sonnet 4, reaching near parity with Claude Sonnet 4 (48.6% win rate) on CC-Bench real-world coding tasks.
リリース日
2025-09-30
パラメータ
357.0B
コンテキスト長
205K
モダリティ
image, text, video
能力レーダー
45
general
44
coding
85
reasoning
51
science推定
40
agents
20
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 84 | 43.0 | LS |
| Code Ranking | 111 | 58.0 | AA |
| General Ranking | 135 | 61.0 | AA |
| Math Reasoning | 54 | 87.0 | AA |
| Science | 122 | 58.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
BrowseComp
45.1%自己申告
Terminal-Bench
40.5%自己申告
Biology
GPQA
81.0%自己申告
Code
SWE-Bench Verified
68.0%自己申告
General
LiveCodeBench v6
82.8%自己申告
Math
AIME 2025
93.9%自己申告
Humanity's Last Exam
17.2%自己申告
AA評価指数
Math Index86.0
Intelligence Index32.5
Coding Index29.5
Aime 250.9
Mmlu Pro0.8
Gpqa0.8
Tau20.7
Livecodebench0.7
Lcr0.5
Ifbench0.4
Scicode0.4
Terminalbench Hard0.3
Hle0.1
LLM Statsカテゴリスコア
Biology80
Chemistry80
General80
Physics80
Frontend Development70
Math60
Reasoning60
Code50
Search50
Agents40
Vision20
価格設定
入力価格$0.55 / 1M tokens
出力価格$2.2 / 1M tokens
混合価格(3:1)$0.963 / 1M tokens
速度
トークン/秒37.2 tokens/s
初トークン遅延0.82s
初回答遅延54.62s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| Fireworks | 550K | 2.2M |
| DeepInfra | 600K | 2.0M |