Passer au contenu principal

Phi-4

MicrosoftPhiOpen WeightMIT · Usage Commercial

Description

phi-4 is a state-of-the-art open model built to excel at advanced reasoning, coding, and knowledge tasks. It leverages a blend of synthetic data, filtered web data, academic texts, and supervised fine-tuning for precision, alignment, and safety.

Date de sortie
2024-12-12
Paramètres
14.7B
Longueur du contexte
16K
Modalités
text

Radar de capacités

25
general
24
coding
30
reasoning
36
scienceest.
28
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement codage447
10.0
AA
Classement général431
22.0
AA
Raisonnement mathématique267
30.0
AA
Science320
35.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA56.1%Aut.

Code

HumanEval82.6%Aut.

Creativity

Arena Hard75.4%Aut.

Factuality

SimpleQA3.0%Aut.

Finance

MMLU84.8%Aut.
MMLU-Pro70.4%Aut.

General

IFEval63.0%Aut.
PhiBench56.2%Aut.
LiveBench47.6%Aut.

Math

MGSM80.6%Aut.
MATH80.4%Aut.
DROP75.5%Aut.

Reasoning

HumanEval+82.8%Aut.

Indices d'évaluation AA

Math Index
18.0
Intelligence Index
4.9
Math 500
0.8
Mmlu Pro
0.7
Gpqa
0.6
Scicode
0.3
Ifbench
0.2
Livecodebench
0.2
Aime 25
0.2
Aime
0.1
Hle
0.0
Terminalbench Hard
0.0
Lcr
0.0
Tau2
0.0

Scores par catégorie LLM Stats

Language
80
Legal
80
Finance
80
Healthcare
80
Code
80
Creativity
80
Writing
80
Math
70
Reasoning
70
Instruction Following
60
Physics
60
Structured Output
60
General
60
Biology
60
Chemistry
60
Factuality
0

Tarification

Prix d'entrée$0.125 / 1M tokens
Prix de sortie$0.5 / 1M tokens
Prix mixte (3:1)$0.219 / 1M tokens

Vitesse

Tokens/sec40.8
Délai du premier token0.47s
Temps de réponse0.47s

Classement des Prix par Fournisseur

Classement des Prix par Fournisseur

3 fournisseurs

Moins cher: MicrosoftPlus cher: Azure
FournisseurEntréeSortie
1MicrosoftPRINCIPAL
$0.125
$0.5
2Azure Cognitive Services
$0.17
$0.68
3Azure
$0.17
$0.68

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes