跳轉到主要內容

Phi-4 Mini Instruct

MicrosoftPhiOpen WeightMIT · Commercial OK

描述

Phi 4 Mini Instruct is a lightweight (3.8B parameters) open model built upon synthetic data and filtered web data, focusing on high-quality reasoning. It supports a 128K token context length and is enhanced for instruction adherence and safety via supervised fine-tuning and direct preference optimization.

發布日期
2024-02-26
參數規模
3.8B
上下文長度
128K
支援模態
text

能力雷達圖

19
general
7
coding
18
reasoning
20
science估算
0
agents
0
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域#排名分數來源
代码能力榜427
9.0
AA
通用能力榜452
17.0
AA
数学推理310
18.0
AA
推理能力50
69.0
LS
科学能力425
18.0
AA

基準測試分數 (LLM Stats)

Biology

GPQA25.2%自報

Creativity

Social IQa72.5%自報
Arena Hard32.8%自報

Finance

MMLU67.3%自報
TruthfulQA66.4%自報
MMLU-Pro52.8%自報

General

ARC-C83.7%自報
OpenBookQA79.2%自報
PIQA77.6%自報
Multilingual MMLU49.3%自報

Language

BoolQ81.2%自報
BIG-Bench Hard70.4%自報
Winogrande67.0%自報

Math

GSM8k88.6%自報
MATH64.0%自報
MGSM63.9%自報

Reasoning

HellaSwag69.1%自報

AA 評測指數

Intelligence Index
8.4
Math Index
6.7
Coding Index
3.6
Math 500
0.7
Mmlu Pro
0.5
Gpqa
0.3
Ifbench
0.2
Lcr
0.1
Livecodebench
0.1
Scicode
0.1
Tau2
0.1
Aime 25
0.1
Hle
0.0
Aime
0.0
Terminalbench Hard
0.0

LLM Stats 分類評分

Math
70
Psychology
70
Reasoning
70
Finance
60
General
60
Healthcare
60
Language
60
Legal
60
Creativity
50
Physics
50
Writing
30
Biology
30
Chemistry
30

定價

輸入價格免費
輸出價格免費
混合價格(3:1)免費

速度

Tokens/秒44.6 tokens/s
首Token延遲0.33s
首回答延遲0.33s

可用提供商

(LS 內部計價單位)

暫無提供商資料

外部連結