メインコンテンツへスキップ

Llama 3.2 Instruct 90B (Vision)

MetaLlamaOpen WeightLlama 3.2 · Commercial OK

説明

Llama 3.2 90B is a large multimodal language model optimized for visual recognition, image reasoning, and captioning tasks. It supports a context length of 128,000 tokens and is designed for deployment on edge and mobile devices, offering state-of-the-art performance in image understanding and generative tasks.

リリース日
2024-09-25
パラメータ
90.0B
コンテキスト長
モダリティ
image, text

能力レーダー

27
general
22
coding
30
reasoning
29
science推定
0
agents
85
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking315
23.0
AA
General Ranking334
33.0
AA
Math Reasoning253
33.0
AA
Multimodal Ranking28
81.0
LS
Science355
30.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA46.7%自己申告

Finance

MMLU86.0%自己申告

General

MMMU60.3%自己申告
MMMU-Pro45.2%自己申告

Image To Text

DocVQA90.1%自己申告
VQAv278.1%自己申告
TextVQA73.5%自己申告

Math

MGSM86.9%自己申告
MATH68.0%自己申告
MathVista57.3%自己申告

Multimodal

AI2D92.3%自己申告
ChartQA85.5%自己申告
InfographicsQA56.8%自己申告

AA評価指数

Intelligence Index
11.9
Mmlu Pro
0.7
Math 500
0.6
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Aime
0.1
Hle
0.0

LLM Statsカテゴリスコア

Finance
90
Language
90
Legal
90
Image To Text
80
Vision
70
Healthcare
70
Math
70
Multimodal
70
Reasoning
70
General
60
Biology
50
Chemistry
50
Physics
50

価格設定

入力価格$1.38 / 1M tokens
出力価格$1.38 / 1M tokens
混合価格(3:1)$1.38 / 1M tokens

速度

トークン/秒54.2 tokens/s
初トークン遅延0.54s
初回答遅延0.54s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク