Saltar al contenido principal

Grok-1.5

xAIGrokProprietary

Descripción

An advanced language model with improved reasoning capabilities, particularly excelling in coding and mathematical tasks. Features a 128K token context window and enhanced problem-solving abilities compared to its predecessor.

Fecha de lanzamiento
2024-03-28
Parámetros
Longitud del contexto
Modalidades

Radar de capacidades

60
general
70
coding
70
reasoning
34
scienceest.
0
agents
90
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Multimodal Ranking18
86.0
LS

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA35.9%Aut.

Code

HumanEval74.1%Aut.

Finance

MMLU81.3%Aut.
MMLU-Pro51.0%Aut.

General

MMMU53.6%Aut.

Image To Text

DocVQA85.6%Aut.

Math

GSM8k90.0%Aut.
MathVista52.8%Aut.
MATH50.6%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

Image To Text
90
Code
70
Finance
70
Language
70
Legal
70
Math
70
Vision
60
General
60
Healthcare
60
Multimodal
60
Reasoning
60
Biology
40
Chemistry
40
Physics
40

Precios

No hay datos de precios disponibles

Velocidad

No hay datos de velocidad disponibles

Proveedores disponibles

(Unidades internas LS)

No hay datos de proveedores disponibles

Fuentes externas