Phi-4
MicrosoftPhiOpen WeightMIT · Commercial OK
説明
phi-4 is a state-of-the-art open model built to excel at advanced reasoning, coding, and knowledge tasks. It leverages a blend of synthetic data, filtered web data, academic texts, and supervised fine-tuning for precision, alignment, and safety.
リリース日
2024-12-12
パラメータ
14.7B
コンテキスト長
16K
モダリティ
text
能力レーダー
28
general
17
coding
30
reasoning
36
science推定
0
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 390 | 14.0 | AA |
| General Ranking | 415 | 23.0 | AA |
| Math Reasoning | 267 | 30.0 | AA |
| Reasoning | 25 | 83.0 | LS |
| Science | 295 | 36.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
56.1%自己申告
Code
HumanEval
82.6%自己申告
Creativity
Arena Hard
75.4%自己申告
Factuality
SimpleQA
3.0%自己申告
Finance
MMLU
84.8%自己申告
MMLU-Pro
70.4%自己申告
General
IFEval
63.0%自己申告
PhiBench
56.2%自己申告
LiveBench
47.6%自己申告
Math
MGSM
80.6%自己申告
MATH
80.4%自己申告
DROP
75.5%自己申告
Reasoning
HumanEval+
82.8%自己申告
AA評価指数
Math Index18.0
Coding Index11.2
Intelligence Index10.4
Math 5000.8
Mmlu Pro0.7
Gpqa0.6
Scicode0.3
Ifbench0.2
Livecodebench0.2
Aime 250.2
Aime0.1
Hle0.0
Terminalbench Hard0.0
Lcr0.0
Tau20.0
LLM Statsカテゴリスコア
Writing80
Code80
Creativity80
Finance80
Healthcare80
Language80
Legal80
Math70
Reasoning70
Structured Output60
Biology60
Chemistry60
General60
Instruction Following60
Physics60
Factuality0
価格設定
入力価格$0.125 / 1M tokens
出力価格$0.5 / 1M tokens
混合価格(3:1)$0.219 / 1M tokens
速度
トークン/秒38.5 tokens/s
初トークン遅延0.51s
初回答遅延0.51s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません