GLM-4.5V (Non-reasoning)
Z AIGLMOpen WeightMIT · Commercial OK
Descripción
GLM-4.5V is a multimodal (vision-language) model based on GLM-4.5-Air (106B total, 12B active) that extends hybrid reasoning to images and video. It achieves state-of-the-art results across 40+ VLM benchmarks (image reasoning, video understanding, GUI tasks, chart/document parsing, grounding) while supporting a Thinking Mode switch for deep reasoning. Released under MIT with FP8/BF16 variants and tooling in Transformers, vLLM, and SGLang.
Fecha de lanzamiento
2025-08-11
Parámetros
108.0B
Longitud del contexto
66K
Modalidades
image, text, video
Radar de capacidades
30
general
20
coding
22
reasoning
33
scienceest.
0
agents
90
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Code Ranking | 368 | 17.0 | AA |
| General Ranking | 363 | 31.0 | AA |
| Math Reasoning | 321 | 15.0 | AA |
| Science | 353 | 31.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
No hay datos de benchmarks disponibles
Índices de evaluación AA
Math Index15.3
Intelligence Index12.7
Coding Index10.8
Mmlu Pro0.8
Gpqa0.6
Livecodebench0.4
Ifbench0.3
Tau20.2
Scicode0.2
Aime 250.2
Terminalbench Hard0.1
Hle0.0
Lcr0.0
Puntuaciones por categoría LLM Stats
No hay datos de puntuación por categoría disponibles
Precios
Precio de entrada$0.6 / 1M tokens
Precio de salida$1.8 / 1M tokens
Precio mixto (3:1)$0.9 / 1M tokens
Velocidad
Tokens/seg48.4 tokens/s
Retraso del primer token37.83s
Tiempo hasta la respuesta37.83s
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles