Pixtral-12B

Mistral AIOpen WeightApache 2.0 · Usage Commercial

Description

A 12B parameter multimodal model with a 400M parameter vision encoder, capable of understanding both natural images and documents. Excels at multimodal tasks while maintaining strong text-only performance. Supports variable image sizes and multiple images in context.

Date de sortie

2024-09-17

Paramètres

12.4B

Longueur du contexte

128K

Modalités

image, text

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement multimodal	48	76.0	LS

Scores de benchmarks (LLM Stats)

Code

HumanEval

72.0%Aut.

Communication

MT-Bench

0.77 / 100Aut.

MM-MT-Bench

0.60 / 100Aut.

Finance

MMLU

69.2%Aut.

General

IFEval

61.3%Aut.

MMMU

52.5%Aut.

Image To Text

DocVQA

90.7%Aut.

VQAv2

78.6%Aut.

Math

MathVista

58.0%Aut.

MATH

48.1%Aut.

Multimodal

ChartQA

81.8%Aut.

MM IF-Eval

52.7%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Image To Text

Roleplay

Creativity

Language

Legal

Multimodal

Reasoning

Finance

Code

Communication

Vision

Instruction Following

Math

Structured Output

General

Healthcare

Tarification

Prix d'entrée$0.15 / 1M tokens

Prix de sortie$0.15 / 1M tokens

Prix mixte (3:1)$0.15 / 1M tokens

Vitesse

Aucune donnée de vitesse disponible

Classement des Prix par Fournisseur

4 fournisseurs

Moins cher: Mistral AIPlus cher: Scaleway

FournisseurEntréeSortie

1Mistral AIPRINCIPAL

$0.15

2Mistral

$0.15

3Vercel AI Gateway

$0.15

4Scaleway

$0.2

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

LLM Stats Artificial Analysis