Grok 2

xAIGrok

Description

Grok-2 is a frontier language model with state-of-the-art reasoning capabilities, featuring advanced abilities in chat, coding, and reasoning. It demonstrates superior performance in visual math reasoning, document-based question answering, and excels across various academic benchmarks including reasoning, reading comprehension, math, and science.

Date de sortie

2024-12

Paramètres

—

Longueur du contexte

—

Modalités

—

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Aucune donnée de classement disponible

Scores de benchmarks (LLM Stats)

Biology

GPQA

56.0%Aut.

Code

HumanEval

88.4%Aut.

Finance

MMLU

87.5%Aut.

MMLU-Pro

75.5%Aut.

General

MMMU

66.1%Aut.

Image To Text

DocVQA

93.6%Aut.

Math

MATH

76.1%Aut.

MathVista

69.0%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Image To Text

Code

Language

Legal

Math

Multimodal

Finance

Healthcare

Vision

Reasoning

General

Physics

Biology

Chemistry

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes

Artificial Analysis