메인 콘텐츠로 건너뛰기

Pixtral-12B

Mistral AIOpen WeightApache 2.0 · Commercial OK

설명

A 12B parameter multimodal model with a 400M parameter vision encoder, capable of understanding both natural images and documents. Excels at multimodal tasks while maintaining strong text-only performance. Supports variable image sizes and multiple images in context.

출시일
2024-09-17
파라미터
12.4B
컨텍스트 길이
모달리티
image, text

능력 레이더

60
general
70
coding
60
reasoning
51
science추정
0
agents
80
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
Multimodal Ranking44
76.0
LS

벤치마크 점수 (LLM Stats)

Code

HumanEval72.0%자체 보고

Communication

MT-Bench0.77 / 100자체 보고
MM-MT-Bench0.60 / 100자체 보고

Finance

MMLU69.2%자체 보고

General

IFEval61.3%자체 보고
MMMU52.5%자체 보고

Image To Text

DocVQA90.7%자체 보고
VQAv278.6%자체 보고

Math

MathVista58.0%자체 보고
MATH48.1%자체 보고

Multimodal

ChartQA81.8%자체 보고
MM IF-Eval52.7%자체 보고

AA 평가 지수

AA 평가 데이터가 없습니다

LLM Stats 카테고리 점수

Creativity
80
Image To Text
80
Roleplay
80
Vision
70
Code
70
Communication
70
Finance
70
Language
70
Legal
70
Multimodal
70
Reasoning
70
Structured Output
60
General
60
Healthcare
60
Instruction Following
60
Math
60

가격

가격 데이터가 없습니다

속도

속도 데이터가 없습니다

사용 가능한 프로바이더

(LS 내부 단위)

프로바이더 데이터가 없습니다

외부 링크