跳轉到主要內容

Phi-3 Mini Instruct 3.8B

MicrosoftPhi
發布日期
2024-04-23
參數規模
上下文長度
16K
支援模態
text

能力雷達圖

16
general
11
coding
11
reasoning
18
science估算
11
agents
0
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域#排名分數來源
程式碼能力榜472
5.0
AA
通用能力榜483
15.0
AA
數學推理338
9.0
AA
推理能力27
83.0
LS
科學能力466
16.0
AA

基準測試分數 (LLM Stats)

Biology

GPQA56.1%自報

Code

HumanEval82.6%自報

Creativity

Arena Hard75.4%自報

Factuality

SimpleQA3.0%自報

Finance

MMLU84.8%自報
MMLU-Pro70.4%自報

General

IFEval63.0%自報
PhiBench56.2%自報
LiveBench47.6%自報

Math

MGSM80.6%自報
MATH80.4%自報
DROP75.5%自報

Reasoning

HumanEval+82.8%自報

AA 評測指數

Intelligence Index
4.6
Math 500
0.5
Mmlu Pro
0.4
Gpqa
0.3
Math Index
0.3
Ifbench
0.2
Livecodebench
0.1
Scicode
0.1
Hle
0.0
Aime
0.0
Lcr
0.0
Aime 25
0.0
Terminalbench Hard
0.0
Tau2
0.0

LLM Stats 分類評分

Language
80
Legal
80
Finance
80
Healthcare
80
Code
80
Creativity
80
Writing
80
Math
70
Reasoning
70
Instruction Following
60
Physics
60
Structured Output
60
General
60
Biology
60
Chemistry
60
Factuality
0

定價

輸入價格免費
輸出價格免費
混合價格(3:1)免費

速度

Tokens/秒0.0
首Token延遲0.00s
首回答延遲0.00s

供應商價格排行

供應商價格排行

4 個供應商

最便宜: Kilo Gateway最貴: Azure
供應商輸入輸出
1Kilo Gateway最便宜
$0.06
$0.14
2OpenRouter
$0.065
$0.14
3Azure Cognitive Services
$0.13
$0.52
4Azure
$0.13
$0.52

比較該模型在不同 API 供應商之間的定價。

外部連結