メインコンテンツへスキップ

Phi-4 Mini Instruct

MicrosoftPhiOpen WeightMIT · Commercial OK

説明

Phi 4 Mini Instruct is a lightweight (3.8B parameters) open model built upon synthetic data and filtered web data, focusing on high-quality reasoning. It supports a 128K token context length and is enhanced for instruction adherence and safety via supervised fine-tuning and direct preference optimization.

リリース日
2024-02-26
パラメータ
3.8B
コンテキスト長
128K
モダリティ
text

能力レーダー

19
general
7
coding
18
reasoning
20
science推定
0
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking427
9.0
AA
General Ranking452
17.0
AA
Math Reasoning310
18.0
AA
Reasoning50
69.0
LS
Science425
18.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA25.2%自己申告

Creativity

Social IQa72.5%自己申告
Arena Hard32.8%自己申告

Finance

MMLU67.3%自己申告
TruthfulQA66.4%自己申告
MMLU-Pro52.8%自己申告

General

ARC-C83.7%自己申告
OpenBookQA79.2%自己申告
PIQA77.6%自己申告
Multilingual MMLU49.3%自己申告

Language

BoolQ81.2%自己申告
BIG-Bench Hard70.4%自己申告
Winogrande67.0%自己申告

Math

GSM8k88.6%自己申告
MATH64.0%自己申告
MGSM63.9%自己申告

Reasoning

HellaSwag69.1%自己申告

AA評価指数

Intelligence Index
8.4
Math Index
6.7
Coding Index
3.6
Math 500
0.7
Mmlu Pro
0.5
Gpqa
0.3
Ifbench
0.2
Lcr
0.1
Livecodebench
0.1
Scicode
0.1
Tau2
0.1
Aime 25
0.1
Hle
0.0
Aime
0.0
Terminalbench Hard
0.0

LLM Statsカテゴリスコア

Math
70
Psychology
70
Reasoning
70
Finance
60
General
60
Healthcare
60
Language
60
Legal
60
Creativity
50
Physics
50
Writing
30
Biology
30
Chemistry
30

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料

速度

トークン/秒44.6 tokens/s
初トークン遅延0.33s
初回答遅延0.33s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク