跳转到主要内容

Grok Beta

xAIGrok

发布日期

2024-08-13

参数规模

—

上下文长度

—

支持模态

—

能力雷达图

26

general

25

coding

37

reasoning

32

science估算

33

agents

90

multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域	#排名	分数	来源
代码能力榜	317	26.0	AA
通用能力榜	337	33.0	AA
数学推理	216	42.0	AA
科学能力	351	33.0	AA

基准测试分数 (LLM Stats)

Biology

GPQA

56.0%自报

Code

HumanEval

88.4%自报

Finance

MMLU

87.5%自报

MMLU-Pro

75.5%自报

General

MMMU

66.1%自报

Image To Text

DocVQA

93.6%自报

Math

MATH

76.1%自报

MathVista

69.0%自报

AA 评测指数

Intelligence Index

7.5

Math 500

0.7

Mmlu Pro

0.7

Gpqa

0.5

Scicode

0.3

Livecodebench

0.2

Aime

0.1

Hle

0.0

LLM Stats 分类评分

Image To Text

90

Code

90

Language

80

Legal

80

Math

80

Multimodal

80

Finance

80

Healthcare

80

Vision

80

Reasoning

70

General

70

Physics

60

Biology

60

Chemistry

60

定价

输入价格免费

输出价格免费

混合价格(3:1)免费

速度

Tokens/秒0.0

首Token延迟0.00s

首回答延迟0.00s

供应商价格排行

供应商价格排行

1 个供应商

供应商输入输出

1NanoGPT

$1.25

$2.5

比较该模型在不同 API 供应商之间的定价。

外部链接

Artificial Analysis