Llama 3.2 Instruct 90B (Vision)
MetaLlamaOpen WeightLlama 3.2 · Commercial OK
Описание
Llama 3.2 90B is a large multimodal language model optimized for visual recognition, image reasoning, and captioning tasks. It supports a context length of 128,000 tokens and is designed for deployment on edge and mobile devices, offering state-of-the-art performance in image understanding and generative tasks.
Дата выхода
2024-09-25
Параметры
90.0B
Длина контекста
—
Модальности
image, text
Радар способностей
27
general
22
coding
30
reasoning
29
scienceоцен.
0
agents
85
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 315 | 23.0 | AA |
| General Ranking | 334 | 33.0 | AA |
| Math Reasoning | 253 | 33.0 | AA |
| Multimodal Ranking | 28 | 81.0 | LS |
| Science | 355 | 30.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
46.7%Сам.
Finance
MMLU
86.0%Сам.
General
MMMU
60.3%Сам.
MMMU-Pro
45.2%Сам.
Image To Text
DocVQA
90.1%Сам.
VQAv2
78.1%Сам.
TextVQA
73.5%Сам.
Math
MGSM
86.9%Сам.
MATH
68.0%Сам.
MathVista
57.3%Сам.
Multimodal
AI2D
92.3%Сам.
ChartQA
85.5%Сам.
InfographicsQA
56.8%Сам.
Индексы оценки AA
Intelligence Index11.9
Mmlu Pro0.7
Math 5000.6
Gpqa0.4
Scicode0.2
Livecodebench0.2
Aime0.1
Hle0.0
Оценки категорий LLM Stats
Finance90
Language90
Legal90
Image To Text80
Vision70
Healthcare70
Math70
Multimodal70
Reasoning70
General60
Biology50
Chemistry50
Physics50
Цены
Цена ввода$1.38 / 1M tokens
Цена вывода$1.38 / 1M tokens
Смешанная цена (3:1)$1.38 / 1M tokens
Скорость
Токенов/сек54.2 tokens/s
Задержка первого токена0.54s
Время до первого ответа0.54s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров