メインコンテンツへスキップ

GLM-4.5V (Non-reasoning)

Z AIGLMOpen WeightMIT · Commercial OK

説明

GLM-4.5V is a multimodal (vision-language) model based on GLM-4.5-Air (106B total, 12B active) that extends hybrid reasoning to images and video. It achieves state-of-the-art results across 40+ VLM benchmarks (image reasoning, video understanding, GUI tasks, chart/document parsing, grounding) while supporting a Thinking Mode switch for deep reasoning. Released under MIT with FP8/BF16 variants and tooling in Transformers, vLLM, and SGLang.

リリース日
2025-08-11
パラメータ
108.0B
コンテキスト長
66K
モダリティ
image, text, video

能力レーダー

30
general
20
coding
22
reasoning
33
science推定
0
agents
90
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking368
17.0
AA
General Ranking363
31.0
AA
Math Reasoning321
15.0
AA
Science353
31.0
AA

ベンチマークスコア (LLM Stats)

ベンチマークデータがありません

AA評価指数

Math Index
15.3
Intelligence Index
12.7
Coding Index
10.8
Mmlu Pro
0.8
Gpqa
0.6
Livecodebench
0.4
Ifbench
0.3
Tau2
0.2
Scicode
0.2
Aime 25
0.2
Terminalbench Hard
0.1
Hle
0.0
Lcr
0.0

LLM Statsカテゴリスコア

カテゴリスコアデータがありません

価格設定

入力価格$0.6 / 1M tokens
出力価格$1.8 / 1M tokens
混合価格(3:1)$0.9 / 1M tokens

速度

トークン/秒48.4 tokens/s
初トークン遅延37.83s
初回答遅延37.83s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク