Phi-3.5-mini-instruct
MicrosoftPhiOpen WeightMIT · Commercial OK
説明
Phi-3.5-mini-instruct is a 3.8B-parameter model that supports up to 128K context tokens, with improved multilingual capabilities across over 20 languages. It underwent additional training and safety post-training to enhance instruction-following, reasoning, math, and code generation. Ideal for environments with memory or latency constraints, it uses an MIT license.
リリース日
2024-08-23
パラメータ
3.8B
コンテキスト長
—
モダリティ
text
能力レーダー
60
general
60
coding
60
reasoning
26
science推定
0
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Reasoning | 51 | 69.0 | LS |
ベンチマークスコア (LLM Stats)
Biology
GPQA
30.4%自己申告
Code
RepoQA
77.0%自己申告
HumanEval
62.8%自己申告
Creativity
Social IQa
74.7%自己申告
Arena Hard
37.0%自己申告
Finance
MMLU
69.0%自己申告
TruthfulQA
64.0%自己申告
MMLU-Pro
47.4%自己申告
General
ARC-C
84.6%自己申告
PIQA
81.0%自己申告
OpenBookQA
79.2%自己申告
MBPP
0.70 / 100自己申告
MMMLU
55.4%自己申告
Language
BoolQ
78.0%自己申告
MEGA XStoryCloze
73.5%自己申告
BIG-Bench Hard
69.0%自己申告
Winogrande
68.5%自己申告
MEGA XCOPA
63.1%自己申告
MEGA TyDi QA
62.2%自己申告
MEGA MLQA
61.7%自己申告
MEGA UDPOS
46.5%自己申告
SQuALITY
24.3%自己申告
Long Context
RULER
84.1%自己申告
Qasper
41.9%自己申告
GovReport
25.9%自己申告
QMSum
21.3%自己申告
SummScreenFD
16.0%自己申告
Math
GSM8k
86.2%自己申告
MATH
48.5%自己申告
MGSM
47.9%自己申告
Reasoning
HellaSwag
69.4%自己申告
AA評価指数
AA評価データがありません
LLM Statsカテゴリスコア
Psychology70
Reasoning70
Code60
Creativity60
Finance60
General60
Healthcare60
Language60
Legal60
Math60
Physics60
Long Context50
Writing40
Biology30
Chemistry30
Summarization20
価格設定
価格データがありません
速度
速度データがありません
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません