Grok-1.5V
xAIGrokProprietary
描述
A multimodal model capable of processing text and visual information, including documents, diagrams, charts, screenshots, and photographs. Notable for strong real-world spatial understanding capabilities.
發布日期
2024-04-12
參數規模
—
上下文長度
—
支援模態
—
能力雷達圖
50
general
0
coding
50
reasoning
43
science估算
0
agents
80
multimodal
Science 在缺少專門科學評測時使用推理能力代理估算。
排行榜排名
| 領域 | #排名 | 分數 | 來源 |
|---|---|---|---|
| 多模态榜 | 26 | 82.0 | LS |
基準測試分數 (LLM Stats)
General
MMMU
53.6%自報
Image To Text
DocVQA
85.6%自報
TextVQA
78.1%自報
Math
MathVista
52.8%自報
Multimodal
AI2D
88.3%自報
ChartQA
76.1%自報
Spatial Reasoning
RealWorldQA
68.7%自報
AA 評測指數
暫無 AA 評測資料
LLM Stats 分類評分
Image To Text80
Spatial Reasoning70
Vision70
Multimodal70
Reasoning70
General50
Healthcare50
Math50
定價
暫無定價資料
速度
暫無速度資料
可用提供商
(LS 內部計價單位)暫無提供商資料