Перейти к основному содержанию

GLM-4.5V (Non-reasoning)

Z AIGLMOpen WeightMIT · Commercial OK

Описание

GLM-4.5V is a multimodal (vision-language) model based on GLM-4.5-Air (106B total, 12B active) that extends hybrid reasoning to images and video. It achieves state-of-the-art results across 40+ VLM benchmarks (image reasoning, video understanding, GUI tasks, chart/document parsing, grounding) while supporting a Thinking Mode switch for deep reasoning. Released under MIT with FP8/BF16 variants and tooling in Transformers, vLLM, and SGLang.

Дата выхода
2025-08-11
Параметры
108.0B
Длина контекста
66K
Модальности
image, text, video

Радар способностей

30
general
20
coding
22
reasoning
33
scienceоцен.
0
agents
90
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Code Ranking368
17.0
AA
General Ranking363
31.0
AA
Math Reasoning321
15.0
AA
Science353
31.0
AA

Оценки бенчмарков (LLM Stats)

Нет данных бенчмарков

Индексы оценки AA

Math Index
15.3
Intelligence Index
12.7
Coding Index
10.8
Mmlu Pro
0.8
Gpqa
0.6
Livecodebench
0.4
Ifbench
0.3
Tau2
0.2
Scicode
0.2
Aime 25
0.2
Terminalbench Hard
0.1
Hle
0.0
Lcr
0.0

Оценки категорий LLM Stats

Нет данных оценки категорий

Цены

Цена ввода$0.6 / 1M tokens
Цена вывода$1.8 / 1M tokens
Смешанная цена (3:1)$0.9 / 1M tokens

Скорость

Токенов/сек48.4 tokens/s
Задержка первого токена37.83s
Время до первого ответа37.83s

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки