GLM-4.5-Air
Z AIGLMOpen WeightMIT · Commercial OK
説明
GLM-4.5-Air is a more compact variant of GLM-4.5 designed for efficient Agentic, Reasoning, and Coding (ARC) applications. It features 106 billion total parameters with 12 billion active parameters using MoE architecture. Like GLM-4.5, it is a hybrid reasoning model providing thinking mode for complex reasoning and tool usage, and non-thinking mode for immediate responses. Despite its compact design, GLM-4.5-Air delivers competitive performance with a score of 59.8 across 12 industry-standard benchmarks, ranking 6th overall while maintaining superior efficiency. It supports 128K context length and is released under MIT open-source license allowing commercial use.
リリース日
2025-07-28
パラメータ
106.0B
コンテキスト長
131K
モダリティ
text
能力レーダー
38
general
40
coding
79
reasoning
45
science推定
70
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 89 | 38.0 | LS |
| Code Ranking | 159 | 49.0 | AA |
| General Ranking | 216 | 48.0 | AA |
| Math Reasoning | 73 | 83.0 | AA |
| Science | 211 | 47.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
BFCL-v3
76.4%自己申告
Terminal-Bench
30.0%自己申告
BrowseComp
21.3%自己申告
Biology
GPQA
75.0%自己申告
SciCode
37.3%自己申告
Code
LiveCodeBench
70.7%自己申告
SWE-Bench Verified
57.6%自己申告
Communication
TAU-bench Retail
77.9%自己申告
TAU-bench Airline
60.8%自己申告
Finance
MMLU-Pro
81.4%自己申告
General
AA-Index
64.8%自己申告
Math
MATH-500
98.1%自己申告
AIME 2024
89.4%自己申告
Humanity's Last Exam
10.6%自己申告
AA評価指数
Math Index80.7
Coding Index23.8
Intelligence Index23.2
Math 5001.0
Mmlu Pro0.8
Aime 250.8
Gpqa0.7
Livecodebench0.7
Aime0.7
Tau20.5
Lcr0.4
Ifbench0.4
Scicode0.3
Terminalbench Hard0.2
Hle0.1
LLM Statsカテゴリスコア
Structured Output80
Finance80
Healthcare80
Language80
Legal80
Tool Calling70
Communication70
General70
Biology60
Chemistry60
Frontend Development60
Math60
Physics60
Reasoning60
Code50
Agents40
Search20
Vision10
価格設定
入力価格$0.17 / 1M tokens
出力価格$0.98 / 1M tokens
混合価格(3:1)$0.372 / 1M tokens
速度
トークン/秒84.4 tokens/s
初トークン遅延1.39s
初回答遅延25.10s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません