Phi-3.5-mini-instruct
MicrosoftPhi開源權重MIT · 商用許可
描述
Phi-3.5-mini-instruct is a 3.8B-parameter model that supports up to 128K context tokens, with improved multilingual capabilities across over 20 languages. It underwent additional training and safety post-training to enhance instruction-following, reasoning, math, and code generation. Ideal for environments with memory or latency constraints, it uses an MIT license.
發布日期
2024-08-23
參數規模
3.8B
上下文長度
128K
支援模態
text
能力雷達圖
60
general
60
coding
60
reasoning
26
science估算
60
agents
0
multimodal
Science 在缺少專門科學評測時使用推理能力代理估算。
排行榜排名
| 領域 | #排名 | 分數 | 來源 |
|---|---|---|---|
| 推理能力 | 55 | 69.0 | LS |
基準測試分數 (LLM Stats)
Biology
GPQA
30.4%自報
Code
RepoQA
77.0%自報
HumanEval
62.8%自報
Creativity
Social IQa
74.7%自報
Arena Hard
37.0%自報
Finance
MMLU
69.0%自報
TruthfulQA
64.0%自報
MMLU-Pro
47.4%自報
General
ARC-C
84.6%自報
PIQA
81.0%自報
OpenBookQA
79.2%自報
MBPP
0.70 / 100自報
MMMLU
55.4%自報
Language
BoolQ
78.0%自報
MEGA XStoryCloze
73.5%自報
BIG-Bench Hard
69.0%自報
Winogrande
68.5%自報
MEGA XCOPA
63.1%自報
MEGA TyDi QA
62.2%自報
MEGA MLQA
61.7%自報
MEGA UDPOS
46.5%自報
SQuALITY
24.3%自報
Long Context
RULER
84.1%自報
Qasper
41.9%自報
GovReport
25.9%自報
QMSum
21.3%自報
SummScreenFD
16.0%自報
Math
GSM8k
86.2%自報
MATH
48.5%自報
MGSM
47.9%自報
Reasoning
HellaSwag
69.4%自報
AA 評測指數
暫無 AA 評測資料
LLM Stats 分類評分
Psychology70
Reasoning70
Language60
Legal60
Math60
Physics60
Finance60
General60
Healthcare60
Code60
Creativity60
Long Context50
Writing40
Biology30
Chemistry30
Summarization20
定價
輸入價格$0.08 / 1M tokens
輸出價格$0.35 / 1M tokens
混合價格(3:1)$0.1475 / 1M tokens
快取讀取價格$0.08 / 1M tokens
速度
暫無速度資料
供應商價格排行
供應商價格排行
5 個供應商
最便宜: Microsoft最貴: Azure
供應商輸入輸出
1Microsoft主要
$0.08
$0.35
2OpenRouter
$0.08
$0.35
3Kilo Gateway
$0.08
$0.35
4Azure Cognitive Services
$0.13
$0.52
5Azure
$0.13
$0.52
比較該模型在不同 API 供應商之間的定價。