Grok Beta
xAIGrok
Дата выхода
2024-08-13
Параметры
—
Длина контекста
—
Модальности
—
Радар способностей
26
general
25
coding
37
reasoning
32
scienceоцен.
33
agents
90
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 317 | 26.0 | AA |
| Общий рейтинг | 337 | 33.0 | AA |
| Математическое мышление | 216 | 42.0 | AA |
| Наука | 351 | 33.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
56.0%Сам.
Code
HumanEval
88.4%Сам.
Finance
MMLU
87.5%Сам.
MMLU-Pro
75.5%Сам.
General
MMMU
66.1%Сам.
Image To Text
DocVQA
93.6%Сам.
Math
MATH
76.1%Сам.
MathVista
69.0%Сам.
Индексы оценки AA
Intelligence Index7.5
Math 5000.7
Mmlu Pro0.7
Gpqa0.5
Scicode0.3
Livecodebench0.2
Aime0.1
Hle0.0
Оценки категорий LLM Stats
Image To Text90
Code90
Language80
Legal80
Math80
Multimodal80
Finance80
Healthcare80
Vision80
Reasoning70
General70
Physics60
Biology60
Chemistry60
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
1 провайдеров
ПровайдерВводВывод
1NanoGPT
$1.25
$2.5
Сравнение цен разных API-провайдеров для этой модели.