Saltar al contenido principal

Grok Build 0.1 0616

xAIGrok
Fecha de lanzamiento
Parámetros
Longitud del contexto
Modalidades

Radar de capacidades

39
general
51
coding
90
reasoning
65
scienceest.
78
agents
90
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking de codificación64
73.0
AA
Ranking general92
66.0
AA
Ciencia21
82.0
AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA56.0%Aut.

Code

HumanEval88.4%Aut.

Finance

MMLU87.5%Aut.
MMLU-Pro75.5%Aut.

General

MMMU66.1%Aut.

Image To Text

DocVQA93.6%Aut.

Math

MATH76.1%Aut.
MathVista69.0%Aut.

Índices de evaluación AA

Coding Index
51.5
Intelligence Index
39.8
Gpqa
0.9
Lcr
0.6
Terminalbench V2 1
0.5
Scicode
0.5
Hle
0.4
Tau Banking
0.1

Puntuaciones por categoría LLM Stats

Image To Text
90
Code
90
Math
80
Multimodal
80
Language
80
Legal
80
Finance
80
Healthcare
80
Vision
80
Reasoning
70
General
70
Physics
60
Biology
60
Chemistry
60

Precios

Precio de entrada$1 / 1M tokens
Precio de salida$2 / 1M tokens
Precio mixto (3:1)$1.25 / 1M tokens

Velocidad

Tokens/seg69.4
Retraso del primer token0.40s
Tiempo hasta la respuesta29.21s

Ranking de Precios por Proveedor

Ranking de Precios por Proveedor

10 proveedores

Más barato: xAIMás caro: FastRouter
ProveedorEntradaSalida
1xAIPRINCIPAL
$1
$2
2NanoGPT
$1
$2
3OpenRouter
$1
$2
4ZenMux
$1
$2
5Kilo Gateway
$1
$2
6OpenCode Zen
$1
$2
7Venice AI
$1
$2
8Vercel AI Gateway
$1
$2
9LLM Gateway
$1
$2
10FastRouter
$1
$2

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas