Pixtral-12B
Mistral AIOpen WeightApache 2.0 · Commercial OK
Description
A 12B parameter multimodal model with a 400M parameter vision encoder, capable of understanding both natural images and documents. Excels at multimodal tasks while maintaining strong text-only performance. Supports variable image sizes and multiple images in context.
Date de sortie
2024-09-17
Paramètres
12.4B
Longueur du contexte
—
Modalités
image, text
Radar de capacités
60
general
70
coding
60
reasoning
51
scienceest.
0
agents
80
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Multimodal Ranking | 44 | 76.0 | LS |
Scores de benchmarks (LLM Stats)
Code
HumanEval
72.0%Aut.
Communication
MT-Bench
0.77 / 100Aut.
MM-MT-Bench
0.60 / 100Aut.
Finance
MMLU
69.2%Aut.
General
IFEval
61.3%Aut.
MMMU
52.5%Aut.
Image To Text
DocVQA
90.7%Aut.
VQAv2
78.6%Aut.
Math
MathVista
58.0%Aut.
MATH
48.1%Aut.
Multimodal
ChartQA
81.8%Aut.
MM IF-Eval
52.7%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Creativity80
Image To Text80
Roleplay80
Vision70
Code70
Communication70
Finance70
Language70
Legal70
Multimodal70
Reasoning70
Structured Output60
General60
Healthcare60
Instruction Following60
Math60
Tarification
Aucune donnée de prix disponible
Vitesse
Aucune donnée de vitesse disponible
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible