Pixtral-12B
Mistral AIOpen WeightApache 2.0 · Commercial OK
Описание
A 12B parameter multimodal model with a 400M parameter vision encoder, capable of understanding both natural images and documents. Excels at multimodal tasks while maintaining strong text-only performance. Supports variable image sizes and multiple images in context.
Дата выхода
2024-09-17
Параметры
12.4B
Длина контекста
—
Модальности
image, text
Радар способностей
60
general
70
coding
60
reasoning
51
scienceоцен.
0
agents
80
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Multimodal Ranking | 44 | 76.0 | LS |
Оценки бенчмарков (LLM Stats)
Code
HumanEval
72.0%Сам.
Communication
MT-Bench
0.77 / 100Сам.
MM-MT-Bench
0.60 / 100Сам.
Finance
MMLU
69.2%Сам.
General
IFEval
61.3%Сам.
MMMU
52.5%Сам.
Image To Text
DocVQA
90.7%Сам.
VQAv2
78.6%Сам.
Math
MathVista
58.0%Сам.
MATH
48.1%Сам.
Multimodal
ChartQA
81.8%Сам.
MM IF-Eval
52.7%Сам.
Индексы оценки AA
Нет данных AA оценки
Оценки категорий LLM Stats
Creativity80
Image To Text80
Roleplay80
Vision70
Code70
Communication70
Finance70
Language70
Legal70
Multimodal70
Reasoning70
Structured Output60
General60
Healthcare60
Instruction Following60
Math60
Цены
Нет данных о ценах
Скорость
Нет данных о скорости
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров