Saltar al contenido principal

Phi-4 Multimodal Instruct

MicrosoftPhiOpen WeightMIT · Uso Comercial

Descripción

Phi-4-multimodal-instruct is a lightweight (5.57B parameters) open multimodal foundation model that leverages research and datasets from Phi-3.5 and 4.0. It processes text, image, and audio inputs to generate text outputs, supporting a 128K token context length. Enhanced via SFT, DPO, and RLHF for instruction following and safety.

Fecha de lanzamiento
2025-02-26
Parámetros
5.6B
Longitud del contexto
Modalidades
image, text

Radar de capacidades

18
general
13
coding
32
reasoning
19
scienceest.
26
agents
85
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking de codificación416
14.0
AA
Ranking general440
21.0
AA
Razonamiento matemático228
39.0
AA
Ranking multimodal28
82.0
LS
Ciencia453
17.0
AA

Puntuaciones de benchmarks (LLM Stats)

3d

BLINK61.3%Aut.

General

MMMU55.1%Aut.
MMMU-Pro38.5%Aut.

Image To Text

DocVQA93.2%Aut.
OCRBench84.4%Aut.
TextVQA75.6%Aut.

Math

MathVista62.4%Aut.
InterGPS48.6%Aut.

Multimodal

ScienceQA Visual97.5%Aut.
MMBench86.7%Aut.
POPE85.6%Aut.
AI2D82.3%Aut.
ChartQA81.4%Aut.
InfoVQA72.7%Aut.
Video-MME55.0%Aut.

Índices de evaluación AA

Intelligence Index
4.5
Math 500
0.7
Mmlu Pro
0.5
Gpqa
0.3
Livecodebench
0.1
Scicode
0.1
Aime
0.1
Hle
0.0

Puntuaciones por categoría LLM Stats

Image To Text
80
Multimodal
70
Reasoning
70
Vision
70
Math
60
Spatial Reasoning
60
Healthcare
60
3d
60
General
50

Precios

Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis

Velocidad

Tokens/seg16.0
Retraso del primer token1.34s
Tiempo hasta la respuesta1.34s

Ranking de Precios por Proveedor

Ranking de Precios por Proveedor

4 proveedores

Más barato: NanoGPTMás caro: evroc
ProveedorEntradaSalida
1NanoGPTMás barato
$0.07
$0.11
2Azure Cognitive Services
$0.08
$0.32
3Azure
$0.08
$0.32
4evroc
$0.24
$0.47

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas