跳轉到主要內容

Phi-4

MicrosoftPhiOpen WeightMIT · Commercial OK

描述

phi-4 is a state-of-the-art open model built to excel at advanced reasoning, coding, and knowledge tasks. It leverages a blend of synthetic data, filtered web data, academic texts, and supervised fine-tuning for precision, alignment, and safety.

發布日期
2024-12-12
參數規模
14.7B
上下文長度
16K
支援模態
text

能力雷達圖

28
general
17
coding
30
reasoning
36
science估算
0
agents
0
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域#排名分數來源
代码能力榜390
14.0
AA
通用能力榜415
23.0
AA
数学推理267
30.0
AA
推理能力25
83.0
LS
科学能力295
36.0
AA

基準測試分數 (LLM Stats)

Biology

GPQA56.1%自報

Code

HumanEval82.6%自報

Creativity

Arena Hard75.4%自報

Factuality

SimpleQA3.0%自報

Finance

MMLU84.8%自報
MMLU-Pro70.4%自報

General

IFEval63.0%自報
PhiBench56.2%自報
LiveBench47.6%自報

Math

MGSM80.6%自報
MATH80.4%自報
DROP75.5%自報

Reasoning

HumanEval+82.8%自報

AA 評測指數

Math Index
18.0
Coding Index
11.2
Intelligence Index
10.4
Math 500
0.8
Mmlu Pro
0.7
Gpqa
0.6
Scicode
0.3
Ifbench
0.2
Livecodebench
0.2
Aime 25
0.2
Aime
0.1
Hle
0.0
Terminalbench Hard
0.0
Lcr
0.0
Tau2
0.0

LLM Stats 分類評分

Writing
80
Code
80
Creativity
80
Finance
80
Healthcare
80
Language
80
Legal
80
Math
70
Reasoning
70
Structured Output
60
Biology
60
Chemistry
60
General
60
Instruction Following
60
Physics
60
Factuality
0

定價

輸入價格$0.125 / 1M tokens
輸出價格$0.5 / 1M tokens
混合價格(3:1)$0.219 / 1M tokens

速度

Tokens/秒38.5 tokens/s
首Token延遲0.51s
首回答延遲0.51s

可用提供商

(LS 內部計價單位)

暫無提供商資料

外部連結