メインコンテンツへスキップ

Grok 3

xAIGrokProprietary

説明

Grok 3, launched by xAI on February 17, 2025, is an advanced AI model with significantly enhanced capabilities compared to Grok 2, boasting an order of magnitude increase in performance. Trained on a vast dataset that includes legal documents among others, and utilizing a massive compute infrastructure with around 200,000 GPUs in a Memphis data center, Grok 3's training used ten times more compute than its predecessor. It features specialized models like Grok 3 Reasoning and Grok 3 Mini Reasoning for complex problem-solving, and it excels in benchmarks like AIME for mathematics and GPQA for PhD-level science.

リリース日
2025-02-19
パラメータ
コンテキスト長
131K
モダリティ
image, text

能力レーダー

39
general
29
coding
57
reasoning
45
science推定
0
agents
80
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking201
41.0
AA
General Ranking186
52.0
AA
Math Reasoning150
60.0
AA
Science210
47.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA84.6%自己申告

Code

LiveCodeBench79.4%自己申告

General

MMMU78.0%自己申告

Math

AIME 202593.3%自己申告
AIME 202493.3%自己申告

AA評価指数

Math Index
58.0
Intelligence Index
25.2
Coding Index
19.8
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.7
Aime 25
0.6
Lcr
0.5
Tau2
0.5
Ifbench
0.5
Livecodebench
0.4
Scicode
0.4
Aime
0.3
Terminalbench Hard
0.1
Hle
0.1

LLM Statsカテゴリスコア

Math
90
Reasoning
90
Vision
80
Biology
80
Chemistry
80
Code
80
General
80
Healthcare
80
Multimodal
80
Physics
80

価格設定

入力価格$3 / 1M tokens
出力価格$15 / 1M tokens
混合価格(3:1)$6 / 1M tokens

速度

トークン/秒43.6 tokens/s
初トークン遅延0.59s
初回答遅延0.59s

利用可能なプロバイダー

(LS内部単位)
プロバイダー入力価格出力価格
xAI3.0M15.0M

外部リンク