Grok-1.5
xAIGrokProprietary
Description
An advanced language model with improved reasoning capabilities, particularly excelling in coding and mathematical tasks. Features a 128K token context window and enhanced problem-solving abilities compared to its predecessor.
Date de sortie
2024-03-28
Paramètres
—
Longueur du contexte
—
Modalités
—
Radar de capacités
60
general
70
coding
70
reasoning
34
scienceest.
0
agents
90
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Multimodal Ranking | 18 | 86.0 | LS |
Scores de benchmarks (LLM Stats)
Biology
GPQA
35.9%Aut.
Code
HumanEval
74.1%Aut.
Finance
MMLU
81.3%Aut.
MMLU-Pro
51.0%Aut.
General
MMMU
53.6%Aut.
Image To Text
DocVQA
85.6%Aut.
Math
GSM8k
90.0%Aut.
MathVista
52.8%Aut.
MATH
50.6%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Image To Text90
Code70
Finance70
Language70
Legal70
Math70
Vision60
General60
Healthcare60
Multimodal60
Reasoning60
Biology40
Chemistry40
Physics40
Tarification
Aucune donnée de prix disponible
Vitesse
Aucune donnée de vitesse disponible
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible