Grok-1.5
xAIGrokProprietary
説明
An advanced language model with improved reasoning capabilities, particularly excelling in coding and mathematical tasks. Features a 128K token context window and enhanced problem-solving abilities compared to its predecessor.
リリース日
2024-03-28
パラメータ
—
コンテキスト長
—
モダリティ
—
能力レーダー
60
general
70
coding
70
reasoning
34
science推定
0
agents
90
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Multimodal Ranking | 18 | 86.0 | LS |
ベンチマークスコア (LLM Stats)
Biology
GPQA
35.9%自己申告
Code
HumanEval
74.1%自己申告
Finance
MMLU
81.3%自己申告
MMLU-Pro
51.0%自己申告
General
MMMU
53.6%自己申告
Image To Text
DocVQA
85.6%自己申告
Math
GSM8k
90.0%自己申告
MathVista
52.8%自己申告
MATH
50.6%自己申告
AA評価指数
AA評価データがありません
LLM Statsカテゴリスコア
Image To Text90
Code70
Finance70
Language70
Legal70
Math70
Vision60
General60
Healthcare60
Multimodal60
Reasoning60
Biology40
Chemistry40
Physics40
価格設定
価格データがありません
速度
速度データがありません
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません