メインコンテンツへスキップ

Pixtral-12B

Mistral AIOpen WeightApache 2.0 · Commercial OK

説明

A 12B parameter multimodal model with a 400M parameter vision encoder, capable of understanding both natural images and documents. Excels at multimodal tasks while maintaining strong text-only performance. Supports variable image sizes and multiple images in context.

リリース日
2024-09-17
パラメータ
12.4B
コンテキスト長
モダリティ
image, text

能力レーダー

60
general
70
coding
60
reasoning
51
science推定
0
agents
80
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Multimodal Ranking44
76.0
LS

ベンチマークスコア (LLM Stats)

Code

HumanEval72.0%自己申告

Communication

MT-Bench0.77 / 100自己申告
MM-MT-Bench0.60 / 100自己申告

Finance

MMLU69.2%自己申告

General

IFEval61.3%自己申告
MMMU52.5%自己申告

Image To Text

DocVQA90.7%自己申告
VQAv278.6%自己申告

Math

MathVista58.0%自己申告
MATH48.1%自己申告

Multimodal

ChartQA81.8%自己申告
MM IF-Eval52.7%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Creativity
80
Image To Text
80
Roleplay
80
Vision
70
Code
70
Communication
70
Finance
70
Language
70
Legal
70
Multimodal
70
Reasoning
70
Structured Output
60
General
60
Healthcare
60
Instruction Following
60
Math
60

価格設定

価格データがありません

速度

速度データがありません

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク