GLM-4.5V (Non-reasoning)
Z AIGLMOpen WeightMIT · Commercial OK
Description
GLM-4.5V is a multimodal (vision-language) model based on GLM-4.5-Air (106B total, 12B active) that extends hybrid reasoning to images and video. It achieves state-of-the-art results across 40+ VLM benchmarks (image reasoning, video understanding, GUI tasks, chart/document parsing, grounding) while supporting a Thinking Mode switch for deep reasoning. Released under MIT with FP8/BF16 variants and tooling in Transformers, vLLM, and SGLang.
Date de sortie
2025-08-11
Paramètres
108.0B
Longueur du contexte
66K
Modalités
image, text, video
Radar de capacités
30
general
20
coding
22
reasoning
33
scienceest.
0
agents
90
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Code Ranking | 368 | 17.0 | AA |
| General Ranking | 363 | 31.0 | AA |
| Math Reasoning | 321 | 15.0 | AA |
| Science | 353 | 31.0 | AA |
Scores de benchmarks (LLM Stats)
Aucune donnée de benchmark disponible
Indices d'évaluation AA
Math Index15.3
Intelligence Index12.7
Coding Index10.8
Mmlu Pro0.8
Gpqa0.6
Livecodebench0.4
Ifbench0.3
Tau20.2
Scicode0.2
Aime 250.2
Terminalbench Hard0.1
Hle0.0
Lcr0.0
Scores par catégorie LLM Stats
Aucune donnée de score par catégorie disponible
Tarification
Prix d'entrée$0.6 / 1M tokens
Prix de sortie$1.8 / 1M tokens
Prix mixte (3:1)$0.9 / 1M tokens
Vitesse
Tokens/sec48.4 tokens/s
Délai du premier token37.83s
Temps de réponse37.83s
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible