Phi-4 Multimodal Instruct

MicrosoftPhiOpen WeightMIT · Uso Comercial

Descripción

Phi-4-multimodal-instruct is a lightweight (5.57B parameters) open multimodal foundation model that leverages research and datasets from Phi-3.5 and 4.0. It processes text, image, and audio inputs to generate text outputs, supporting a 128K token context length. Enhanced via SFT, DPO, and RLHF for instruction following and safety.

Fecha de lanzamiento

2025-02-26

Parámetros

5.6B

Longitud del contexto

—

Modalidades

image, text

Radar de capacidades

general

coding

reasoning

scienceest.

agents

multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio	#Posición	Puntuación	Fuente
Ranking de codificación	416	14.0	AA
Ranking general	440	21.0	AA
Razonamiento matemático	228	39.0	AA
Ranking multimodal	28	82.0	LS
Ciencia	453	17.0	AA

Puntuaciones de benchmarks (LLM Stats)

3d

BLINK

61.3%Aut.

General

MMMU

55.1%Aut.

MMMU-Pro

38.5%Aut.

Image To Text

DocVQA

93.2%Aut.

OCRBench

84.4%Aut.

TextVQA

75.6%Aut.

Math

MathVista

62.4%Aut.

InterGPS

48.6%Aut.

Multimodal

ScienceQA Visual

97.5%Aut.

MMBench

86.7%Aut.

POPE

85.6%Aut.

AI2D

82.3%Aut.

ChartQA

81.4%Aut.

InfoVQA

72.7%Aut.

Video-MME

55.0%Aut.

Índices de evaluación AA

Intelligence Index

4.5

Math 500

0.7

Mmlu Pro

0.5

Gpqa

0.3

Livecodebench

0.1

Scicode

0.1

Aime

0.1

Hle

0.0

Puntuaciones por categoría LLM Stats

Image To Text

Multimodal

Reasoning

Vision

Math

Spatial Reasoning

Healthcare

General

Precios

Precio de entradaGratis

Precio de salidaGratis

Precio mixto (3:1)Gratis

Velocidad

Tokens/seg16.0

Retraso del primer token1.34s

Tiempo hasta la respuesta1.34s

Ranking de Precios por Proveedor

4 proveedores

Más barato: NanoGPTMás caro: evroc

ProveedorEntradaSalida

1NanoGPTMás barato

$0.07

$0.11

2Azure Cognitive Services

$0.08

$0.32

3Azure

$0.08

$0.32

4evroc

$0.24

$0.47

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas

LLM Stats Artificial Analysis