メインコンテンツへスキップ

Grok 4

xAIGrokProprietary

説明

Grok 4, announced by xAI in summer 2025, represents a major leap in AI capabilities, described as 'the smartest AI in the world.' Built on version 6 of xAI's foundation model, it uses 100x more training compute than Grok 2 and 10x more reinforcement learning compute than Grok 3. The model achieves PhD-level performance across all academic disciplines simultaneously, scoring perfect on standardized tests like the SAT and near-perfect on graduate exams like the GRE. Unlike Grok 3, tool usage is built into the training process rather than relying on generalization. Trained using 200,000 GPUs, Grok 4 excels at complex reasoning, mathematical problem-solving, and coding tasks, though it has acknowledged weaknesses in multimodal capabilities that are being addressed in the next version.

リリース日
2025-07-10
パラメータ
コンテキスト長
256K
モダリティ
file, image, text

能力レーダー

52
general
56
coding
94
reasoning
60
science推定
0
agents
80
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking37
76.0
AA
General Ranking77
73.0
AA
Math Reasoning11
96.0
AA
Reasoning103
16.0
LS
Science43
74.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA87.5%自己申告

Code

LiveCodeBench79.0%自己申告

Math

AIME 202591.7%自己申告
HMMT2590.0%自己申告
Humanity's Last Exam40.0%自己申告
USAMO2537.5%自己申告

Reasoning

ARC-AGI v215.9%自己申告

AA評価指数

Math Index
92.7
Intelligence Index
41.5
Coding Index
40.5
Math 500
1.0
Aime
0.9
Aime 25
0.9
Gpqa
0.9
Mmlu Pro
0.9
Livecodebench
0.8
Tau2
0.7
Lcr
0.7
Ifbench
0.5
Scicode
0.5
Terminalbench Hard
0.4
Hle
0.2

LLM Statsカテゴリスコア

Biology
90
Chemistry
90
Physics
90
Code
80
General
80
Math
60
Reasoning
60
Vision
30
Spatial Reasoning
20

価格設定

入力価格$4.25 / 1M tokens
出力価格$21.25 / 1M tokens
混合価格(3:1)$8.5 / 1M tokens

速度

トークン/秒47.2 tokens/s
初トークン遅延14.13s
初回答遅延14.13s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク

Grok 4 — xAI | AITier