Phi-4 Mini Instruct
MicrosoftPhiオープンウエイトMIT · 商用利用可
説明
Phi 4 Mini Instruct is a lightweight (3.8B parameters) open model built upon synthetic data and filtered web data, focusing on high-quality reasoning. It supports a 128K token context length and is enhanced for instruction adherence and safety via supervised fine-tuning and direct preference optimization.
リリース日
2024-02-26
パラメータ
3.8B
コンテキスト長
128K
モダリティ
text
能力レーダー
16
general
12
coding
18
reasoning
20
science推定
16
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 435 | 11.0 | AA |
| 総合ランキング | 481 | 15.0 | AA |
| 数学的推論 | 310 | 18.0 | AA |
| 推論 | 54 | 69.0 | LS |
| 科学 | 452 | 17.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
25.2%自己申告
Creativity
Social IQa
72.5%自己申告
Arena Hard
32.8%自己申告
Finance
MMLU
67.3%自己申告
TruthfulQA
66.4%自己申告
MMLU-Pro
52.8%自己申告
General
ARC-C
83.7%自己申告
OpenBookQA
79.2%自己申告
PIQA
77.6%自己申告
Multilingual MMLU
49.3%自己申告
Language
BoolQ
81.2%自己申告
BIG-Bench Hard
70.4%自己申告
Winogrande
67.0%自己申告
Math
GSM8k
88.6%自己申告
MATH
64.0%自己申告
MGSM
63.9%自己申告
Reasoning
HellaSwag
69.1%自己申告
AA評価指数
Math Index6.7
Intelligence Index3.0
Math 5000.7
Mmlu Pro0.5
Gpqa0.3
Ifbench0.2
Lcr0.1
Livecodebench0.1
Scicode0.1
Tau20.1
Aime 250.1
Hle0.0
Aime0.0
Terminalbench Hard0.0
LLM Statsカテゴリスコア
Math70
Psychology70
Reasoning70
Language60
Legal60
Finance60
General60
Healthcare60
Physics50
Creativity50
Biology30
Chemistry30
Writing30
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
キャッシュ読み取り価格$0.08 / 1Mトークン
速度
トークン/秒46.2
初トークン遅延0.40s
初回答遅延0.40s
プロバイダー価格ランキング
プロバイダー価格ランキング
4 プロバイダー
最安: Azure Cognitive Services最高: NanoGPT
プロバイダー入力出力
1Azure Cognitive Services最安
$0.075
$0.3
2Azure
$0.075
$0.3
3Weights & Biases
$0.08
$0.35
4NanoGPT
$0.17
$0.68
このモデルの異なるAPIプロバイダー間の価格を比較。