Passer au contenu principal

Phi-4 Multimodal Instruct

MicrosoftPhiOpen WeightMIT · Usage Commercial

Description

Phi-4-multimodal-instruct is a lightweight (5.57B parameters) open multimodal foundation model that leverages research and datasets from Phi-3.5 and 4.0. It processes text, image, and audio inputs to generate text outputs, supporting a 128K token context length. Enhanced via SFT, DPO, and RLHF for instruction following and safety.

Date de sortie
2025-02-26
Paramètres
5.6B
Longueur du contexte
Modalités
image, text

Radar de capacités

18
general
13
coding
32
reasoning
19
scienceest.
26
agents
85
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement codage416
14.0
AA
Classement général440
21.0
AA
Raisonnement mathématique228
39.0
AA
Classement multimodal28
82.0
LS
Science453
17.0
AA

Scores de benchmarks (LLM Stats)

3d

BLINK61.3%Aut.

General

MMMU55.1%Aut.
MMMU-Pro38.5%Aut.

Image To Text

DocVQA93.2%Aut.
OCRBench84.4%Aut.
TextVQA75.6%Aut.

Math

MathVista62.4%Aut.
InterGPS48.6%Aut.

Multimodal

ScienceQA Visual97.5%Aut.
MMBench86.7%Aut.
POPE85.6%Aut.
AI2D82.3%Aut.
ChartQA81.4%Aut.
InfoVQA72.7%Aut.
Video-MME55.0%Aut.

Indices d'évaluation AA

Intelligence Index
4.5
Math 500
0.7
Mmlu Pro
0.5
Gpqa
0.3
Livecodebench
0.1
Scicode
0.1
Aime
0.1
Hle
0.0

Scores par catégorie LLM Stats

Image To Text
80
Multimodal
70
Reasoning
70
Vision
70
Math
60
Spatial Reasoning
60
Healthcare
60
3d
60
General
50

Tarification

Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit

Vitesse

Tokens/sec16.0
Délai du premier token1.34s
Temps de réponse1.34s

Classement des Prix par Fournisseur

Classement des Prix par Fournisseur

4 fournisseurs

Moins cher: NanoGPTPlus cher: evroc
FournisseurEntréeSortie
1NanoGPTMoins cher
$0.07
$0.11
2Azure Cognitive Services
$0.08
$0.32
3Azure
$0.08
$0.32
4evroc
$0.24
$0.47

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes