Grok-1.5
xAIGrokProprietary
Описание
An advanced language model with improved reasoning capabilities, particularly excelling in coding and mathematical tasks. Features a 128K token context window and enhanced problem-solving abilities compared to its predecessor.
Дата выхода
2024-03-28
Параметры
—
Длина контекста
—
Модальности
—
Радар способностей
60
general
70
coding
70
reasoning
34
scienceоцен.
0
agents
90
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Multimodal Ranking | 18 | 86.0 | LS |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
35.9%Сам.
Code
HumanEval
74.1%Сам.
Finance
MMLU
81.3%Сам.
MMLU-Pro
51.0%Сам.
General
MMMU
53.6%Сам.
Image To Text
DocVQA
85.6%Сам.
Math
GSM8k
90.0%Сам.
MathVista
52.8%Сам.
MATH
50.6%Сам.
Индексы оценки AA
Нет данных AA оценки
Оценки категорий LLM Stats
Image To Text90
Code70
Finance70
Language70
Legal70
Math70
Vision60
General60
Healthcare60
Multimodal60
Reasoning60
Biology40
Chemistry40
Physics40
Цены
Нет данных о ценах
Скорость
Нет данных о скорости
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров