Перейти к основному содержанию

Llama 3.2 Instruct 90B (Vision)

MetaLlamaOpen WeightLlama 3.2 · Commercial OK

Описание

Llama 3.2 90B is a large multimodal language model optimized for visual recognition, image reasoning, and captioning tasks. It supports a context length of 128,000 tokens and is designed for deployment on edge and mobile devices, offering state-of-the-art performance in image understanding and generative tasks.

Дата выхода
2024-09-25
Параметры
90.0B
Длина контекста
Модальности
image, text

Радар способностей

27
general
22
coding
30
reasoning
29
scienceоцен.
0
agents
85
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Code Ranking315
23.0
AA
General Ranking334
33.0
AA
Math Reasoning253
33.0
AA
Multimodal Ranking28
81.0
LS
Science355
30.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA46.7%Сам.

Finance

MMLU86.0%Сам.

General

MMMU60.3%Сам.
MMMU-Pro45.2%Сам.

Image To Text

DocVQA90.1%Сам.
VQAv278.1%Сам.
TextVQA73.5%Сам.

Math

MGSM86.9%Сам.
MATH68.0%Сам.
MathVista57.3%Сам.

Multimodal

AI2D92.3%Сам.
ChartQA85.5%Сам.
InfographicsQA56.8%Сам.

Индексы оценки AA

Intelligence Index
11.9
Mmlu Pro
0.7
Math 500
0.6
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Aime
0.1
Hle
0.0

Оценки категорий LLM Stats

Finance
90
Language
90
Legal
90
Image To Text
80
Vision
70
Healthcare
70
Math
70
Multimodal
70
Reasoning
70
General
60
Biology
50
Chemistry
50
Physics
50

Цены

Цена ввода$1.38 / 1M tokens
Цена вывода$1.38 / 1M tokens
Смешанная цена (3:1)$1.38 / 1M tokens

Скорость

Токенов/сек54.2 tokens/s
Задержка первого токена0.54s
Время до первого ответа0.54s

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки