Grok-1.5V
xAIGrokProprietary
विवरण
A multimodal model capable of processing text and visual information, including documents, diagrams, charts, screenshots, and photographs. Notable for strong real-world spatial understanding capabilities.
रिलीज़ तिथि
2024-04-12
पैरामीटर
—
संदर्भ लंबाई
—
मोडैलिटीज़
—
क्षमता रडार
50
general
0
coding
50
reasoning
43
scienceअनुमानित
0
agents
80
multimodal
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| Multimodal Ranking | 26 | 82.0 | LS |
बेंचमार्क स्कोर (LLM Stats)
General
MMMU
53.6%स्वयं
Image To Text
DocVQA
85.6%स्वयं
TextVQA
78.1%स्वयं
Math
MathVista
52.8%स्वयं
Multimodal
AI2D
88.3%स्वयं
ChartQA
76.1%स्वयं
Spatial Reasoning
RealWorldQA
68.7%स्वयं
AA मूल्यांकन सूचकांक
कोई AA मूल्यांकन डेटा उपलब्ध नहीं
LLM Stats श्रेणी स्कोर
Image To Text80
Spatial Reasoning70
Vision70
Multimodal70
Reasoning70
General50
Healthcare50
Math50
मूल्य निर्धारण
कोई मूल्य डेटा उपलब्ध नहीं
गति
कोई गति डेटा उपलब्ध नहीं
उपलब्ध प्रदाता
(LS आंतरिक इकाइयाँ)कोई प्रदाता डेटा उपलब्ध नहीं