Grok Beta

xAIGrok

Date de sortie

2024-08-13

Paramètres

—

Longueur du contexte

—

Modalités

—

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement codage	317	26.0	AA
Classement général	337	33.0	AA
Raisonnement mathématique	216	42.0	AA
Science	351	33.0	AA

Scores de benchmarks (LLM Stats)

Biology

GPQA

56.0%Aut.

Code

HumanEval

88.4%Aut.

Finance

MMLU

87.5%Aut.

MMLU-Pro

75.5%Aut.

General

MMMU

66.1%Aut.

Image To Text

DocVQA

93.6%Aut.

Math

MATH

76.1%Aut.

MathVista

69.0%Aut.

Indices d'évaluation AA

Intelligence Index

7.5

Math 500

0.7

Mmlu Pro

0.7

Gpqa

0.5

Scicode

0.3

Livecodebench

0.2

Aime

0.1

Hle

0.0

Scores par catégorie LLM Stats

Image To Text

Code

Language

Legal

Math

Multimodal

Finance

Healthcare

Vision

Reasoning

General

Physics

Biology

Chemistry

Tarification

Prix d'entréeGratuit

Prix de sortieGratuit

Prix mixte (3:1)Gratuit

Vitesse

Tokens/sec0.0

Délai du premier token0.00s

Temps de réponse0.00s

Classement des Prix par Fournisseur

1 fournisseurs

FournisseurEntréeSortie

1NanoGPT

$1.25

$2.5

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

Artificial Analysis