Phi-3.5-mini-instruct
MicrosoftPhiオープンウエイトMIT · 商用利用可
説明
Phi-3.5-mini-instruct is a 3.8B-parameter model that supports up to 128K context tokens, with improved multilingual capabilities across over 20 languages. It underwent additional training and safety post-training to enhance instruction-following, reasoning, math, and code generation. Ideal for environments with memory or latency constraints, it uses an MIT license.
リリース日
2024-08-23
パラメータ
3.8B
コンテキスト長
128K
モダリティ
text
能力レーダー
60
general
60
coding
60
reasoning
26
science推定
60
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| 推論 | 55 | 69.0 | LS |
ベンチマークスコア (LLM Stats)
Biology
GPQA
30.4%自己申告
Code
RepoQA
77.0%自己申告
HumanEval
62.8%自己申告
Creativity
Social IQa
74.7%自己申告
Arena Hard
37.0%自己申告
Finance
MMLU
69.0%自己申告
TruthfulQA
64.0%自己申告
MMLU-Pro
47.4%自己申告
General
ARC-C
84.6%自己申告
PIQA
81.0%自己申告
OpenBookQA
79.2%自己申告
MBPP
0.70 / 100自己申告
MMMLU
55.4%自己申告
Language
BoolQ
78.0%自己申告
MEGA XStoryCloze
73.5%自己申告
BIG-Bench Hard
69.0%自己申告
Winogrande
68.5%自己申告
MEGA XCOPA
63.1%自己申告
MEGA TyDi QA
62.2%自己申告
MEGA MLQA
61.7%自己申告
MEGA UDPOS
46.5%自己申告
SQuALITY
24.3%自己申告
Long Context
RULER
84.1%自己申告
Qasper
41.9%自己申告
GovReport
25.9%自己申告
QMSum
21.3%自己申告
SummScreenFD
16.0%自己申告
Math
GSM8k
86.2%自己申告
MATH
48.5%自己申告
MGSM
47.9%自己申告
Reasoning
HellaSwag
69.4%自己申告
AA評価指数
AA評価データがありません
LLM Statsカテゴリスコア
Psychology70
Reasoning70
Language60
Legal60
Math60
Physics60
Finance60
General60
Healthcare60
Code60
Creativity60
Long Context50
Writing40
Biology30
Chemistry30
Summarization20
価格設定
入力価格$0.08 / 1Mトークン
出力価格$0.35 / 1Mトークン
混合価格(3:1)$0.1475 / 1Mトークン
キャッシュ読み取り価格$0.08 / 1Mトークン
速度
速度データがありません
プロバイダー価格ランキング
プロバイダー価格ランキング
5 プロバイダー
最安: Microsoft最高: Azure
プロバイダー入力出力
1Microsoftプライマリ
$0.08
$0.35
2OpenRouter
$0.08
$0.35
3Kilo Gateway
$0.08
$0.35
4Azure Cognitive Services
$0.13
$0.52
5Azure
$0.13
$0.52
このモデルの異なるAPIプロバイダー間の価格を比較。