Grok-1.5V
xAIGrokProprietary
설명
A multimodal model capable of processing text and visual information, including documents, diagrams, charts, screenshots, and photographs. Notable for strong real-world spatial understanding capabilities.
출시일
2024-04-12
파라미터
—
컨텍스트 길이
—
모달리티
—
능력 레이더
50
general
0
coding
50
reasoning
43
science추정
0
agents
80
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Multimodal Ranking | 26 | 82.0 | LS |
벤치마크 점수 (LLM Stats)
General
MMMU
53.6%자체 보고
Image To Text
DocVQA
85.6%자체 보고
TextVQA
78.1%자체 보고
Math
MathVista
52.8%자체 보고
Multimodal
AI2D
88.3%자체 보고
ChartQA
76.1%자체 보고
Spatial Reasoning
RealWorldQA
68.7%자체 보고
AA 평가 지수
AA 평가 데이터가 없습니다
LLM Stats 카테고리 점수
Image To Text80
Spatial Reasoning70
Vision70
Multimodal70
Reasoning70
General50
Healthcare50
Math50
가격
가격 데이터가 없습니다
속도
속도 데이터가 없습니다
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다