Passer au contenu principal

Grok-1.5V

xAIGrokProprietary

Description

A multimodal model capable of processing text and visual information, including documents, diagrams, charts, screenshots, and photographs. Notable for strong real-world spatial understanding capabilities.

Date de sortie
2024-04-12
Paramètres
Longueur du contexte
Modalités

Radar de capacités

50
general
0
coding
50
reasoning
43
scienceest.
0
agents
80
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Multimodal Ranking26
82.0
LS

Scores de benchmarks (LLM Stats)

General

MMMU53.6%Aut.

Image To Text

DocVQA85.6%Aut.
TextVQA78.1%Aut.

Math

MathVista52.8%Aut.

Multimodal

AI2D88.3%Aut.
ChartQA76.1%Aut.

Spatial Reasoning

RealWorldQA68.7%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Image To Text
80
Spatial Reasoning
70
Vision
70
Multimodal
70
Reasoning
70
General
50
Healthcare
50
Math
50

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes