メインコンテンツへスキップ

GLM-4.5 (Reasoning)

Z AIGLMOpen WeightMIT · Commercial OK

説明

GLM-4.5 is an Agentic, Reasoning, and Coding (ARC) foundation model designed for intelligent agents, featuring 355 billion total parameters with 32 billion active parameters using MoE architecture. Trained on 23T tokens through multi-stage training, it is a hybrid reasoning model that provides two modes: thinking mode for complex reasoning and tool usage, and non-thinking mode for immediate responses. The model unifies agentic, reasoning, and coding capabilities with 128K context length support. It achieves exceptional performance with a score of 63.2 across 12 industry-standard benchmarks, placing 3rd among all proprietary and open-source models. Released under MIT open-source license allowing commercial use and secondary development.

リリース日
2025-07-28
パラメータ
355.0B
コンテキスト長
131K
モダリティ
text

能力レーダー

41
general
44
coding
81
reasoning
50
science推定
70
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools58
55.0
LS
Code Ranking125
54.0
AA
General Ranking187
52.0
AA
Math Reasoning76
82.0
AA
Science141
55.0
AA

ベンチマークスコア (LLM Stats)

Agents

BFCL-v377.8%自己申告
Terminal-Bench37.5%自己申告
BrowseComp26.4%自己申告

Biology

GPQA79.1%自己申告
SciCode41.7%自己申告

Code

LiveCodeBench72.9%自己申告
SWE-Bench Verified64.2%自己申告

Communication

TAU-bench Retail79.7%自己申告
TAU-bench Airline60.4%自己申告

Finance

MMLU-Pro84.6%自己申告

General

AA-Index67.7%自己申告

Math

MATH-50098.2%自己申告
AIME 202491.0%自己申告
Humanity's Last Exam14.4%自己申告

AA評価指数

Math Index
73.7
Intelligence Index
26.4
Coding Index
26.3
Math 500
1.0
Aime
0.9
Mmlu Pro
0.8
Gpqa
0.8
Livecodebench
0.7
Aime 25
0.7
Lcr
0.5
Ifbench
0.4
Tau2
0.4
Scicode
0.3
Terminalbench Hard
0.2
Hle
0.1

LLM Statsカテゴリスコア

Structured Output
80
Finance
80
General
80
Healthcare
80
Language
80
Legal
80
Tool Calling
70
Communication
70
Math
70
Biology
60
Chemistry
60
Frontend Development
60
Physics
60
Reasoning
60
Agents
50
Code
50
Search
30
Vision
10

価格設定

入力価格$0.6 / 1M tokens
出力価格$2.2 / 1M tokens
混合価格(3:1)$1 / 1M tokens

速度

トークン/秒42.4 tokens/s
初トークン遅延1.03s
初回答遅延48.20s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク