メインコンテンツへスキップ

Phi-3 Mini Instruct 3.8B

MicrosoftPhi
リリース日
2024-04-23
パラメータ
コンテキスト長
16K
モダリティ
text

能力レーダー

16
general
11
coding
11
reasoning
18
science推定
11
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
コーディングランキング472
5.0
AA
総合ランキング483
15.0
AA
数学的推論338
9.0
AA
推論27
83.0
LS
科学466
16.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA56.1%自己申告

Code

HumanEval82.6%自己申告

Creativity

Arena Hard75.4%自己申告

Factuality

SimpleQA3.0%自己申告

Finance

MMLU84.8%自己申告
MMLU-Pro70.4%自己申告

General

IFEval63.0%自己申告
PhiBench56.2%自己申告
LiveBench47.6%自己申告

Math

MGSM80.6%自己申告
MATH80.4%自己申告
DROP75.5%自己申告

Reasoning

HumanEval+82.8%自己申告

AA評価指数

Intelligence Index
4.6
Math 500
0.5
Mmlu Pro
0.4
Gpqa
0.3
Math Index
0.3
Ifbench
0.2
Livecodebench
0.1
Scicode
0.1
Hle
0.0
Aime
0.0
Lcr
0.0
Aime 25
0.0
Terminalbench Hard
0.0
Tau2
0.0

LLM Statsカテゴリスコア

Language
80
Legal
80
Finance
80
Healthcare
80
Code
80
Creativity
80
Writing
80
Math
70
Reasoning
70
Instruction Following
60
Physics
60
Structured Output
60
General
60
Biology
60
Chemistry
60
Factuality
0

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料

速度

トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s

プロバイダー価格ランキング

プロバイダー価格ランキング

4 プロバイダー

最安: Kilo Gateway最高: Azure
プロバイダー入力出力
1Kilo Gateway最安
$0.06
$0.14
2OpenRouter
$0.065
$0.14
3Azure Cognitive Services
$0.13
$0.52
4Azure
$0.13
$0.52

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク