Grok Beta
xAIGrok
リリース日
2024-08-13
パラメータ
—
コンテキスト長
—
モダリティ
—
能力レーダー
26
general
25
coding
37
reasoning
32
science推定
33
agents
90
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 317 | 26.0 | AA |
| 総合ランキング | 337 | 33.0 | AA |
| 数学的推論 | 216 | 42.0 | AA |
| 科学 | 351 | 33.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
56.0%自己申告
Code
HumanEval
88.4%自己申告
Finance
MMLU
87.5%自己申告
MMLU-Pro
75.5%自己申告
General
MMMU
66.1%自己申告
Image To Text
DocVQA
93.6%自己申告
Math
MATH
76.1%自己申告
MathVista
69.0%自己申告
AA評価指数
Intelligence Index7.5
Math 5000.7
Mmlu Pro0.7
Gpqa0.5
Scicode0.3
Livecodebench0.2
Aime0.1
Hle0.0
LLM Statsカテゴリスコア
Image To Text90
Code90
Language80
Legal80
Math80
Multimodal80
Finance80
Healthcare80
Vision80
Reasoning70
General70
Physics60
Biology60
Chemistry60
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
速度
トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s
プロバイダー価格ランキング
プロバイダー価格ランキング
1 プロバイダー
プロバイダー入力出力
1NanoGPT
$1.25
$2.5
このモデルの異なるAPIプロバイダー間の価格を比較。