Phi-4

MicrosoftPhiOpen WeightMIT · Uso Comercial

Descripción

phi-4 is a state-of-the-art open model built to excel at advanced reasoning, coding, and knowledge tasks. It leverages a blend of synthetic data, filtered web data, academic texts, and supervised fine-tuning for precision, alignment, and safety.

Fecha de lanzamiento

2024-12-12

Parámetros

14.7B

Longitud del contexto

16K

Modalidades

text

Radar de capacidades

general

coding

reasoning

scienceest.

agents

multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio	#Posición	Puntuación	Fuente
Ranking de codificación	447	10.0	AA
Ranking general	431	22.0	AA
Razonamiento matemático	267	30.0	AA
Ciencia	320	35.0	AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA

56.1%Aut.

Code

HumanEval

82.6%Aut.

Creativity

Arena Hard

75.4%Aut.

Factuality

SimpleQA

3.0%Aut.

Finance

MMLU

84.8%Aut.

MMLU-Pro

70.4%Aut.

General

IFEval

63.0%Aut.

PhiBench

56.2%Aut.

LiveBench

47.6%Aut.

Math

MGSM

80.6%Aut.

MATH

80.4%Aut.

DROP

75.5%Aut.

Reasoning

HumanEval+

82.8%Aut.

Índices de evaluación AA

Math Index

18.0

Intelligence Index

4.9

Math 500

0.8

Mmlu Pro

0.7

Gpqa

0.6

Scicode

0.3

Ifbench

0.2

Livecodebench

0.2

Aime 25

0.2

Aime

0.1

Hle

0.0

Terminalbench Hard

0.0

Lcr

0.0

Tau2

0.0

Puntuaciones por categoría LLM Stats

Language

Legal

Finance

Healthcare

Code

Creativity

Writing

Math

Reasoning

Instruction Following

Physics

Structured Output

General

Biology

Chemistry

Factuality

Precios

Precio de entrada$0.125 / 1M tokens

Precio de salida$0.5 / 1M tokens

Precio mixto (3:1)$0.219 / 1M tokens

Velocidad

Tokens/seg40.8

Retraso del primer token0.47s

Tiempo hasta la respuesta0.47s

Ranking de Precios por Proveedor

3 proveedores

Más barato: MicrosoftMás caro: Azure

ProveedorEntradaSalida

1MicrosoftPRINCIPAL

$0.125

$0.5

2Azure Cognitive Services

$0.17

$0.68

3Azure

$0.17

$0.68

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas

LLM Stats Artificial Analysis