Grok 4.20 0309 v2 (Reasoning)
説明
Grok 4 Heavy is the multi-agent version of Grok 4, released alongside the standard model in summer 2025. This system spawns multiple Grok 4 agents in parallel that work independently on problems and then collaborate by comparing their solutions, similar to a study group. The agents share insights and tricks they discover, with the system intelligently combining their work rather than simply using majority voting. Grok 4 Heavy uses approximately 10x more test-time compute than regular Grok 4, enabling it to solve significantly more complex problems. On the Humanities Last Exam, it achieves over 50% accuracy on text-only problems, and it scored a perfect result on the AIME 2025 mathematics competition. The system represents a major advancement in multi-agent AI collaboration and reasoning capabilities.
能力レーダー
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 90 | 69.0 | AA |
| 総合ランキング | 38 | 78.0 | AA |
| 科学 | 31 | 77.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
Code
Math
AA評価指数
LLM Statsカテゴリスコア
価格設定
速度
プロバイダー価格ランキング
プロバイダー価格ランキング
8 プロバイダー
このモデルの異なるAPIプロバイダー間の価格を比較。