GLM-4.5V (Non-reasoning)
Z AIGLMOpen WeightMIT · Commercial OK
説明
GLM-4.5V is a multimodal (vision-language) model based on GLM-4.5-Air (106B total, 12B active) that extends hybrid reasoning to images and video. It achieves state-of-the-art results across 40+ VLM benchmarks (image reasoning, video understanding, GUI tasks, chart/document parsing, grounding) while supporting a Thinking Mode switch for deep reasoning. Released under MIT with FP8/BF16 variants and tooling in Transformers, vLLM, and SGLang.
リリース日
2025-08-11
パラメータ
108.0B
コンテキスト長
66K
モダリティ
image, text, video
能力レーダー
30
general
20
coding
22
reasoning
33
science推定
0
agents
90
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 368 | 17.0 | AA |
| General Ranking | 363 | 31.0 | AA |
| Math Reasoning | 321 | 15.0 | AA |
| Science | 353 | 31.0 | AA |
ベンチマークスコア (LLM Stats)
ベンチマークデータがありません
AA評価指数
Math Index15.3
Intelligence Index12.7
Coding Index10.8
Mmlu Pro0.8
Gpqa0.6
Livecodebench0.4
Ifbench0.3
Tau20.2
Scicode0.2
Aime 250.2
Terminalbench Hard0.1
Hle0.0
Lcr0.0
LLM Statsカテゴリスコア
カテゴリスコアデータがありません
価格設定
入力価格$0.6 / 1M tokens
出力価格$1.8 / 1M tokens
混合価格(3:1)$0.9 / 1M tokens
速度
トークン/秒48.4 tokens/s
初トークン遅延37.83s
初回答遅延37.83s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません