Saltar al contenido principal

Grok 2

xAIGrok

Descripción

Grok-2 is a frontier language model with state-of-the-art reasoning capabilities, featuring advanced abilities in chat, coding, and reasoning. It demonstrates superior performance in visual math reasoning, document-based question answering, and excels across various academic benchmarks including reasoning, reading comprehension, math, and science.

Fecha de lanzamiento
2024-12
Parámetros
Longitud del contexto
Modalidades

Radar de capacidades

70
general
90
coding
80
reasoning
51
scienceest.
83
agents
90
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

No hay datos de ranking disponibles

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA56.0%Aut.

Code

HumanEval88.4%Aut.

Finance

MMLU87.5%Aut.
MMLU-Pro75.5%Aut.

General

MMMU66.1%Aut.

Image To Text

DocVQA93.6%Aut.

Math

MATH76.1%Aut.
MathVista69.0%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

Image To Text
90
Code
90
Language
80
Legal
80
Math
80
Multimodal
80
Finance
80
Healthcare
80
Vision
80
Reasoning
70
General
70
Physics
60
Biology
60
Chemistry
60

Precios

No hay datos de precios disponibles

Velocidad

No hay datos de velocidad disponibles

Ranking de Precios por Proveedor

No hay datos de proveedores disponibles

Fuentes externas