Pixtral-12B

Mistral AIОткрытые весаApache 2.0 · Коммерческое использование

Описание

A 12B parameter multimodal model with a 400M parameter vision encoder, capable of understanding both natural images and documents. Excels at multimodal tasks while maintaining strong text-only performance. Supports variable image sizes and multiple images in context.

Дата выхода

2024-09-17

Параметры

12.4B

Длина контекста

128K

Модальности

image, text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Мультимодальный рейтинг	48	76.0	LS

Оценки бенчмарков (LLM Stats)

Code

HumanEval

72.0%Сам.

Communication

MT-Bench

0.77 / 100Сам.

MM-MT-Bench

0.60 / 100Сам.

Finance

MMLU

69.2%Сам.

General

IFEval

61.3%Сам.

MMMU

52.5%Сам.

Image To Text

DocVQA

90.7%Сам.

VQAv2

78.6%Сам.

Math

MathVista

58.0%Сам.

MATH

48.1%Сам.

Multimodal

ChartQA

81.8%Сам.

MM IF-Eval

52.7%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Image To Text

Roleplay

Creativity

Language

Legal

Multimodal

Reasoning

Finance

Code

Communication

Vision

Instruction Following

Math

Structured Output

General

Healthcare

Цены

Цена ввода$0.15 / 1M токенов

Цена вывода$0.15 / 1M токенов

Смешанная цена (3:1)$0.15 / 1M токенов

Скорость

Нет данных о скорости

Рейтинг цен провайдеров

4 провайдеров

Самый дешевый: Mistral AIСамый дорогой: Scaleway

ПровайдерВводВывод

1Mistral AIОсновной

$0.15

2Mistral

$0.15

3Vercel AI Gateway

$0.15

4Scaleway

$0.2

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis