メインコンテンツへスキップ

Phi-4

MicrosoftPhiOpen WeightMIT · Commercial OK

説明

phi-4 is a state-of-the-art open model built to excel at advanced reasoning, coding, and knowledge tasks. It leverages a blend of synthetic data, filtered web data, academic texts, and supervised fine-tuning for precision, alignment, and safety.

リリース日
2024-12-12
パラメータ
14.7B
コンテキスト長
16K
モダリティ
text

能力レーダー

28
general
17
coding
30
reasoning
36
science推定
0
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking390
14.0
AA
General Ranking415
23.0
AA
Math Reasoning267
30.0
AA
Reasoning25
83.0
LS
Science295
36.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA56.1%自己申告

Code

HumanEval82.6%自己申告

Creativity

Arena Hard75.4%自己申告

Factuality

SimpleQA3.0%自己申告

Finance

MMLU84.8%自己申告
MMLU-Pro70.4%自己申告

General

IFEval63.0%自己申告
PhiBench56.2%自己申告
LiveBench47.6%自己申告

Math

MGSM80.6%自己申告
MATH80.4%自己申告
DROP75.5%自己申告

Reasoning

HumanEval+82.8%自己申告

AA評価指数

Math Index
18.0
Coding Index
11.2
Intelligence Index
10.4
Math 500
0.8
Mmlu Pro
0.7
Gpqa
0.6
Scicode
0.3
Ifbench
0.2
Livecodebench
0.2
Aime 25
0.2
Aime
0.1
Hle
0.0
Terminalbench Hard
0.0
Lcr
0.0
Tau2
0.0

LLM Statsカテゴリスコア

Writing
80
Code
80
Creativity
80
Finance
80
Healthcare
80
Language
80
Legal
80
Math
70
Reasoning
70
Structured Output
60
Biology
60
Chemistry
60
General
60
Instruction Following
60
Physics
60
Factuality
0

価格設定

入力価格$0.125 / 1M tokens
出力価格$0.5 / 1M tokens
混合価格(3:1)$0.219 / 1M tokens

速度

トークン/秒38.5 tokens/s
初トークン遅延0.51s
初回答遅延0.51s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク