Grok 2

xAIGrok

Descripción

Grok-2 is a frontier language model with state-of-the-art reasoning capabilities, featuring advanced abilities in chat, coding, and reasoning. It demonstrates superior performance in visual math reasoning, document-based question answering, and excels across various academic benchmarks including reasoning, reading comprehension, math, and science.

Fecha de lanzamiento

2024-12

Parámetros

—

Longitud del contexto

—

Modalidades

—

Radar de capacidades

general

coding

reasoning

scienceest.

agents

multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

No hay datos de ranking disponibles

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA

56.0%Aut.

Code

HumanEval

88.4%Aut.

Finance

MMLU

87.5%Aut.

MMLU-Pro

75.5%Aut.

General

MMMU

66.1%Aut.

Image To Text

DocVQA

93.6%Aut.

Math

MATH

76.1%Aut.

MathVista

69.0%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

Image To Text

Code

Language

Legal

Math

Multimodal

Finance

Healthcare

Vision

Reasoning

General

Physics

Biology

Chemistry

Precios

No hay datos de precios disponibles

Velocidad

No hay datos de velocidad disponibles

Ranking de Precios por Proveedor

No hay datos de proveedores disponibles

Fuentes externas

Artificial Analysis