Phi-4 Mini Instruct
MicrosoftPhiOpen WeightMIT · Commercial OK
説明
Phi 4 Mini Instruct is a lightweight (3.8B parameters) open model built upon synthetic data and filtered web data, focusing on high-quality reasoning. It supports a 128K token context length and is enhanced for instruction adherence and safety via supervised fine-tuning and direct preference optimization.
リリース日
2024-02-26
パラメータ
3.8B
コンテキスト長
128K
モダリティ
text
能力レーダー
19
general
7
coding
18
reasoning
20
science推定
0
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 427 | 9.0 | AA |
| General Ranking | 452 | 17.0 | AA |
| Math Reasoning | 310 | 18.0 | AA |
| Reasoning | 50 | 69.0 | LS |
| Science | 425 | 18.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
25.2%自己申告
Creativity
Social IQa
72.5%自己申告
Arena Hard
32.8%自己申告
Finance
MMLU
67.3%自己申告
TruthfulQA
66.4%自己申告
MMLU-Pro
52.8%自己申告
General
ARC-C
83.7%自己申告
OpenBookQA
79.2%自己申告
PIQA
77.6%自己申告
Multilingual MMLU
49.3%自己申告
Language
BoolQ
81.2%自己申告
BIG-Bench Hard
70.4%自己申告
Winogrande
67.0%自己申告
Math
GSM8k
88.6%自己申告
MATH
64.0%自己申告
MGSM
63.9%自己申告
Reasoning
HellaSwag
69.1%自己申告
AA評価指数
Intelligence Index8.4
Math Index6.7
Coding Index3.6
Math 5000.7
Mmlu Pro0.5
Gpqa0.3
Ifbench0.2
Lcr0.1
Livecodebench0.1
Scicode0.1
Tau20.1
Aime 250.1
Hle0.0
Aime0.0
Terminalbench Hard0.0
LLM Statsカテゴリスコア
Math70
Psychology70
Reasoning70
Finance60
General60
Healthcare60
Language60
Legal60
Creativity50
Physics50
Writing30
Biology30
Chemistry30
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
速度
トークン/秒44.6 tokens/s
初トークン遅延0.33s
初回答遅延0.33s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません