Grok-1.5V
xAIGrokProprietary
Описание
A multimodal model capable of processing text and visual information, including documents, diagrams, charts, screenshots, and photographs. Notable for strong real-world spatial understanding capabilities.
Дата выхода
2024-04-12
Параметры
—
Длина контекста
—
Модальности
—
Радар способностей
50
general
0
coding
50
reasoning
43
scienceоцен.
0
agents
80
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Multimodal Ranking | 26 | 82.0 | LS |
Оценки бенчмарков (LLM Stats)
General
MMMU
53.6%Сам.
Image To Text
DocVQA
85.6%Сам.
TextVQA
78.1%Сам.
Math
MathVista
52.8%Сам.
Multimodal
AI2D
88.3%Сам.
ChartQA
76.1%Сам.
Spatial Reasoning
RealWorldQA
68.7%Сам.
Индексы оценки AA
Нет данных AA оценки
Оценки категорий LLM Stats
Image To Text80
Spatial Reasoning70
Vision70
Multimodal70
Reasoning70
General50
Healthcare50
Math50
Цены
Нет данных о ценах
Скорость
Нет данных о скорости
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров