メインコンテンツへスキップ

Grok Beta

xAIGrok

リリース日

2024-08-13

パラメータ

—

コンテキスト長

—

モダリティ

—

能力レーダー

26

general

25

coding

37

reasoning

32

science推定

33

agents

90

multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン	#順位	スコア	ソース
コーディングランキング	317	26.0	AA
総合ランキング	337	33.0	AA
数学的推論	216	42.0	AA
科学	351	33.0	AA

ベンチマークスコア (LLM Stats)

Biology

GPQA

56.0%自己申告

Code

HumanEval

88.4%自己申告

Finance

MMLU

87.5%自己申告

MMLU-Pro

75.5%自己申告

General

MMMU

66.1%自己申告

Image To Text

DocVQA

93.6%自己申告

Math

MATH

76.1%自己申告

MathVista

69.0%自己申告

AA評価指数

Intelligence Index

7.5

Math 500

0.7

Mmlu Pro

0.7

Gpqa

0.5

Scicode

0.3

Livecodebench

0.2

Aime

0.1

Hle

0.0

LLM Statsカテゴリスコア

Image To Text

90

Code

90

Language

80

Legal

80

Math

80

Multimodal

80

Finance

80

Healthcare

80

Vision

80

Reasoning

70

General

70

Physics

60

Biology

60

Chemistry

60

価格設定

入力価格無料

出力価格無料

混合価格（3:1）無料

速度

トークン/秒0.0

初トークン遅延0.00s

初回答遅延0.00s

プロバイダー価格ランキング

プロバイダー価格ランキング

1 プロバイダー

プロバイダー入力出力

1NanoGPT

$1.25

$2.5

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク

Artificial Analysis