Grok-1.5

xAIGrokProprietary

Description

An advanced language model with improved reasoning capabilities, particularly excelling in coding and mathematical tasks. Features a 128K token context window and enhanced problem-solving abilities compared to its predecessor.

Date de sortie

2024-03-28

Paramètres

—

Longueur du contexte

—

Modalités

—

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Multimodal Ranking	18	86.0	LS

Scores de benchmarks (LLM Stats)

Biology

GPQA

35.9%Aut.

Code

HumanEval

74.1%Aut.

Finance

MMLU

81.3%Aut.

MMLU-Pro

51.0%Aut.

General

MMMU

53.6%Aut.

Image To Text

DocVQA

85.6%Aut.

Math

GSM8k

90.0%Aut.

MathVista

52.8%Aut.

MATH

50.6%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Image To Text

Code

Finance

Language

Legal

Math

Vision

General

Healthcare

Multimodal

Reasoning

Biology

Chemistry

Physics

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes

LLM Stats