Saltar al contenido principal

Phi-4 Mini Instruct

MicrosoftPhiOpen WeightMIT · Commercial OK

Descripción

Phi 4 Mini Instruct is a lightweight (3.8B parameters) open model built upon synthetic data and filtered web data, focusing on high-quality reasoning. It supports a 128K token context length and is enhanced for instruction adherence and safety via supervised fine-tuning and direct preference optimization.

Fecha de lanzamiento
2024-02-26
Parámetros
3.8B
Longitud del contexto
128K
Modalidades
text

Radar de capacidades

19
general
7
coding
18
reasoning
20
scienceest.
0
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Code Ranking427
9.0
AA
General Ranking452
17.0
AA
Math Reasoning310
18.0
AA
Reasoning50
69.0
LS
Science425
18.0
AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA25.2%Aut.

Creativity

Social IQa72.5%Aut.
Arena Hard32.8%Aut.

Finance

MMLU67.3%Aut.
TruthfulQA66.4%Aut.
MMLU-Pro52.8%Aut.

General

ARC-C83.7%Aut.
OpenBookQA79.2%Aut.
PIQA77.6%Aut.
Multilingual MMLU49.3%Aut.

Language

BoolQ81.2%Aut.
BIG-Bench Hard70.4%Aut.
Winogrande67.0%Aut.

Math

GSM8k88.6%Aut.
MATH64.0%Aut.
MGSM63.9%Aut.

Reasoning

HellaSwag69.1%Aut.

Índices de evaluación AA

Intelligence Index
8.4
Math Index
6.7
Coding Index
3.6
Math 500
0.7
Mmlu Pro
0.5
Gpqa
0.3
Ifbench
0.2
Lcr
0.1
Livecodebench
0.1
Scicode
0.1
Tau2
0.1
Aime 25
0.1
Hle
0.0
Aime
0.0
Terminalbench Hard
0.0

Puntuaciones por categoría LLM Stats

Math
70
Psychology
70
Reasoning
70
Finance
60
General
60
Healthcare
60
Language
60
Legal
60
Creativity
50
Physics
50
Writing
30
Biology
30
Chemistry
30

Precios

Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis

Velocidad

Tokens/seg44.6 tokens/s
Retraso del primer token0.33s
Tiempo hasta la respuesta0.33s

Proveedores disponibles

(Unidades internas LS)

No hay datos de proveedores disponibles

Fuentes externas