Grok 4

xAIGrokProprietary

Descripción

Grok 4, announced by xAI in summer 2025, represents a major leap in AI capabilities, described as 'the smartest AI in the world.' Built on version 6 of xAI's foundation model, it uses 100x more training compute than Grok 2 and 10x more reinforcement learning compute than Grok 3. The model achieves PhD-level performance across all academic disciplines simultaneously, scoring perfect on standardized tests like the SAT and near-perfect on graduate exams like the GRE. Unlike Grok 3, tool usage is built into the training process rather than relying on generalization. Trained using 200,000 GPUs, Grok 4 excels at complex reasoning, mathematical problem-solving, and coding tasks, though it has acknowledged weaknesses in multimodal capabilities that are being addressed in the next version.

Fecha de lanzamiento

2025-07-10

Parámetros

—

Longitud del contexto

—

Modalidades

image, text

Radar de capacidades

general

coding

reasoning

scienceest.

agents

multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio	#Posición	Puntuación	Fuente
Ranking de codificación	31	80.0	AA
Ranking general	88	68.0	AA
Razonamiento matemático	11	96.0	AA
Razonamiento	108	16.0	LS
Ciencia	51	71.0	AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA

87.5%Aut.

Code

LiveCodeBench

79.0%Aut.

Math

AIME 2025

91.7%Aut.

HMMT25

90.0%Aut.

Humanity's Last Exam

40.0%Aut.

USAMO25

37.5%Aut.

Reasoning

ARC-AGI v2

15.9%Aut.

Índices de evaluación AA

Math Index

92.7

Intelligence Index

33.3

Math 500

1.0

Aime

0.9

Aime 25

0.9

Gpqa

0.9

Mmlu Pro

0.9

Livecodebench

0.8

Tau2

0.7

Lcr

0.7

Ifbench

0.5

Scicode

0.5

Terminalbench Hard

0.4

Hle

0.2

Puntuaciones por categoría LLM Stats

Physics

Biology

Chemistry

General

Code

Math

Reasoning

Vision

Spatial Reasoning

Precios

Precio de entrada$5.5 / 1M tokens

Precio de salida$27.5 / 1M tokens

Precio mixto (3:1)$11 / 1M tokens

Velocidad

Tokens/seg0.0

Retraso del primer token0.00s

Tiempo hasta la respuesta0.00s

Ranking de Precios por Proveedor

6 proveedores

Más barato: ZenMuxMás caro: xAI

ProveedorEntradaSalida

1ZenMuxMás barato

$15

2Poe

$15

3Helicone

$15

4Requesty

$15

5FastRouter

$15

6xAIPRINCIPAL

$5.5

$27.5

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas

LLM Stats Artificial Analysis