Passer au contenu principal

Grok 2

xAIGrok

Description

Grok-2 is a frontier language model with state-of-the-art reasoning capabilities, featuring advanced abilities in chat, coding, and reasoning. It demonstrates superior performance in visual math reasoning, document-based question answering, and excels across various academic benchmarks including reasoning, reading comprehension, math, and science.

Date de sortie
2024-12
Paramètres
Longueur du contexte
Modalités

Radar de capacités

70
general
90
coding
80
reasoning
51
scienceest.
83
agents
90
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Aucune donnée de classement disponible

Scores de benchmarks (LLM Stats)

Biology

GPQA56.0%Aut.

Code

HumanEval88.4%Aut.

Finance

MMLU87.5%Aut.
MMLU-Pro75.5%Aut.

General

MMMU66.1%Aut.

Image To Text

DocVQA93.6%Aut.

Math

MATH76.1%Aut.
MathVista69.0%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Image To Text
90
Code
90
Language
80
Legal
80
Math
80
Multimodal
80
Finance
80
Healthcare
80
Vision
80
Reasoning
70
General
70
Physics
60
Biology
60
Chemistry
60

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes