メインコンテンツへスキップ

Grok-1.5V

xAIGrokProprietary

説明

A multimodal model capable of processing text and visual information, including documents, diagrams, charts, screenshots, and photographs. Notable for strong real-world spatial understanding capabilities.

リリース日
2024-04-12
パラメータ
コンテキスト長
モダリティ

能力レーダー

50
general
0
coding
50
reasoning
43
science推定
0
agents
80
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Multimodal Ranking26
82.0
LS

ベンチマークスコア (LLM Stats)

General

MMMU53.6%自己申告

Image To Text

DocVQA85.6%自己申告
TextVQA78.1%自己申告

Math

MathVista52.8%自己申告

Multimodal

AI2D88.3%自己申告
ChartQA76.1%自己申告

Spatial Reasoning

RealWorldQA68.7%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Image To Text
80
Spatial Reasoning
70
Vision
70
Multimodal
70
Reasoning
70
General
50
Healthcare
50
Math
50

価格設定

価格データがありません

速度

速度データがありません

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク