跳转到主要内容

Phi-4 Mini Instruct

MicrosoftPhiOpen WeightMIT · Commercial OK

描述

Phi 4 Mini Instruct is a lightweight (3.8B parameters) open model built upon synthetic data and filtered web data, focusing on high-quality reasoning. It supports a 128K token context length and is enhanced for instruction adherence and safety via supervised fine-tuning and direct preference optimization.

发布日期
2024-02-26
参数规模
3.8B
上下文长度
128K
支持模态
text

能力雷达图

19
general
7
coding
18
reasoning
20
science估算
0
agents
0
multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域#排名分数来源
代码能力榜427
9.0
AA
通用能力榜452
17.0
AA
数学推理310
18.0
AA
推理能力50
69.0
LS
科学能力425
18.0
AA

基准测试分数 (LLM Stats)

Biology

GPQA25.2%自报

Creativity

Social IQa72.5%自报
Arena Hard32.8%自报

Finance

MMLU67.3%自报
TruthfulQA66.4%自报
MMLU-Pro52.8%自报

General

ARC-C83.7%自报
OpenBookQA79.2%自报
PIQA77.6%自报
Multilingual MMLU49.3%自报

Language

BoolQ81.2%自报
BIG-Bench Hard70.4%自报
Winogrande67.0%自报

Math

GSM8k88.6%自报
MATH64.0%自报
MGSM63.9%自报

Reasoning

HellaSwag69.1%自报

AA 评测指数

Intelligence Index
8.4
Math Index
6.7
Coding Index
3.6
Math 500
0.7
Mmlu Pro
0.5
Gpqa
0.3
Ifbench
0.2
Lcr
0.1
Livecodebench
0.1
Scicode
0.1
Tau2
0.1
Aime 25
0.1
Hle
0.0
Aime
0.0
Terminalbench Hard
0.0

LLM Stats 分类评分

Math
70
Psychology
70
Reasoning
70
Finance
60
General
60
Healthcare
60
Language
60
Legal
60
Creativity
50
Physics
50
Writing
30
Biology
30
Chemistry
30

定价

输入价格免费
输出价格免费
混合价格(3:1)免费

速度

Tokens/秒44.6 tokens/s
首Token延迟0.33s
首回答延迟0.33s

可用提供商

(LS 内部计价单位)

暂无提供商数据

外部链接