Pixtral-12B
Mistral AIOpen WeightApache 2.0 · Commercial OK
설명
A 12B parameter multimodal model with a 400M parameter vision encoder, capable of understanding both natural images and documents. Excels at multimodal tasks while maintaining strong text-only performance. Supports variable image sizes and multiple images in context.
출시일
2024-09-17
파라미터
12.4B
컨텍스트 길이
—
모달리티
image, text
능력 레이더
60
general
70
coding
60
reasoning
51
science추정
0
agents
80
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Multimodal Ranking | 44 | 76.0 | LS |
벤치마크 점수 (LLM Stats)
Code
HumanEval
72.0%자체 보고
Communication
MT-Bench
0.77 / 100자체 보고
MM-MT-Bench
0.60 / 100자체 보고
Finance
MMLU
69.2%자체 보고
General
IFEval
61.3%자체 보고
MMMU
52.5%자체 보고
Image To Text
DocVQA
90.7%자체 보고
VQAv2
78.6%자체 보고
Math
MathVista
58.0%자체 보고
MATH
48.1%자체 보고
Multimodal
ChartQA
81.8%자체 보고
MM IF-Eval
52.7%자체 보고
AA 평가 지수
AA 평가 데이터가 없습니다
LLM Stats 카테고리 점수
Creativity80
Image To Text80
Roleplay80
Vision70
Code70
Communication70
Finance70
Language70
Legal70
Multimodal70
Reasoning70
Structured Output60
General60
Healthcare60
Instruction Following60
Math60
가격
가격 데이터가 없습니다
속도
속도 데이터가 없습니다
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다