Перейти к основному содержанию

Pixtral-12B

Mistral AIOpen WeightApache 2.0 · Commercial OK

Описание

A 12B parameter multimodal model with a 400M parameter vision encoder, capable of understanding both natural images and documents. Excels at multimodal tasks while maintaining strong text-only performance. Supports variable image sizes and multiple images in context.

Дата выхода
2024-09-17
Параметры
12.4B
Длина контекста
Модальности
image, text

Радар способностей

60
general
70
coding
60
reasoning
51
scienceоцен.
0
agents
80
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Multimodal Ranking44
76.0
LS

Оценки бенчмарков (LLM Stats)

Code

HumanEval72.0%Сам.

Communication

MT-Bench0.77 / 100Сам.
MM-MT-Bench0.60 / 100Сам.

Finance

MMLU69.2%Сам.

General

IFEval61.3%Сам.
MMMU52.5%Сам.

Image To Text

DocVQA90.7%Сам.
VQAv278.6%Сам.

Math

MathVista58.0%Сам.
MATH48.1%Сам.

Multimodal

ChartQA81.8%Сам.
MM IF-Eval52.7%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Creativity
80
Image To Text
80
Roleplay
80
Vision
70
Code
70
Communication
70
Finance
70
Language
70
Legal
70
Multimodal
70
Reasoning
70
Structured Output
60
General
60
Healthcare
60
Instruction Following
60
Math
60

Цены

Нет данных о ценах

Скорость

Нет данных о скорости

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки