Llama 3.2 Instruct 90B (Vision)
MetaLlamaOpen WeightLlama 3.2 · Commercial OK
説明
Llama 3.2 90B is a large multimodal language model optimized for visual recognition, image reasoning, and captioning tasks. It supports a context length of 128,000 tokens and is designed for deployment on edge and mobile devices, offering state-of-the-art performance in image understanding and generative tasks.
リリース日
2024-09-25
パラメータ
90.0B
コンテキスト長
—
モダリティ
image, text
能力レーダー
27
general
22
coding
30
reasoning
29
science推定
0
agents
85
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 315 | 23.0 | AA |
| General Ranking | 334 | 33.0 | AA |
| Math Reasoning | 253 | 33.0 | AA |
| Multimodal Ranking | 28 | 81.0 | LS |
| Science | 355 | 30.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
46.7%自己申告
Finance
MMLU
86.0%自己申告
General
MMMU
60.3%自己申告
MMMU-Pro
45.2%自己申告
Image To Text
DocVQA
90.1%自己申告
VQAv2
78.1%自己申告
TextVQA
73.5%自己申告
Math
MGSM
86.9%自己申告
MATH
68.0%自己申告
MathVista
57.3%自己申告
Multimodal
AI2D
92.3%自己申告
ChartQA
85.5%自己申告
InfographicsQA
56.8%自己申告
AA評価指数
Intelligence Index11.9
Mmlu Pro0.7
Math 5000.6
Gpqa0.4
Scicode0.2
Livecodebench0.2
Aime0.1
Hle0.0
LLM Statsカテゴリスコア
Finance90
Language90
Legal90
Image To Text80
Vision70
Healthcare70
Math70
Multimodal70
Reasoning70
General60
Biology50
Chemistry50
Physics50
価格設定
入力価格$1.38 / 1M tokens
出力価格$1.38 / 1M tokens
混合価格(3:1)$1.38 / 1M tokens
速度
トークン/秒54.2 tokens/s
初トークン遅延0.54s
初回答遅延0.54s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません