Grok 3
xAIGrokProprietary
説明
Grok 3, launched by xAI on February 17, 2025, is an advanced AI model with significantly enhanced capabilities compared to Grok 2, boasting an order of magnitude increase in performance. Trained on a vast dataset that includes legal documents among others, and utilizing a massive compute infrastructure with around 200,000 GPUs in a Memphis data center, Grok 3's training used ten times more compute than its predecessor. It features specialized models like Grok 3 Reasoning and Grok 3 Mini Reasoning for complex problem-solving, and it excels in benchmarks like AIME for mathematics and GPQA for PhD-level science.
リリース日
2025-02-19
パラメータ
—
コンテキスト長
131K
モダリティ
image, text
能力レーダー
39
general
29
coding
57
reasoning
45
science推定
0
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 201 | 41.0 | AA |
| General Ranking | 186 | 52.0 | AA |
| Math Reasoning | 150 | 60.0 | AA |
| Science | 210 | 47.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
84.6%自己申告
Code
LiveCodeBench
79.4%自己申告
General
MMMU
78.0%自己申告
Math
AIME 2025
93.3%自己申告
AIME 2024
93.3%自己申告
AA評価指数
Math Index58.0
Intelligence Index25.2
Coding Index19.8
Math 5000.9
Mmlu Pro0.8
Gpqa0.7
Aime 250.6
Lcr0.5
Tau20.5
Ifbench0.5
Livecodebench0.4
Scicode0.4
Aime0.3
Terminalbench Hard0.1
Hle0.1
LLM Statsカテゴリスコア
Math90
Reasoning90
Vision80
Biology80
Chemistry80
Code80
General80
Healthcare80
Multimodal80
Physics80
価格設定
入力価格$3 / 1M tokens
出力価格$15 / 1M tokens
混合価格(3:1)$6 / 1M tokens
速度
トークン/秒43.6 tokens/s
初トークン遅延0.59s
初回答遅延0.59s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| xAI | 3.0M | 15.0M |