Phi-4

MicrosoftPhiオープンウエイトMIT · 商用利用可

説明

phi-4 is a state-of-the-art open model built to excel at advanced reasoning, coding, and knowledge tasks. It leverages a blend of synthetic data, filtered web data, academic texts, and supervised fine-tuning for precision, alignment, and safety.

リリース日

2024-12-12

パラメータ

14.7B

コンテキスト長

16K

モダリティ

text

能力レーダー

general

coding

reasoning

science推定

agents

multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ベンチマークスコア (LLM Stats)

Biology

GPQA

56.1%自己申告

Code

HumanEval

82.6%自己申告

Creativity

Arena Hard

75.4%自己申告

Factuality

SimpleQA

3.0%自己申告

Finance

MMLU

84.8%自己申告

MMLU-Pro

70.4%自己申告

General

IFEval

63.0%自己申告

PhiBench

56.2%自己申告

LiveBench

47.6%自己申告

Math

MGSM

80.6%自己申告

MATH

80.4%自己申告

DROP

75.5%自己申告

Reasoning

HumanEval+

82.8%自己申告

AA評価指数

Math Index

18.0

Intelligence Index

4.9

Math 500

0.8

Mmlu Pro

0.7

Gpqa

0.6

Scicode

0.3

Ifbench

0.2

Livecodebench

0.2

Aime 25

0.2

Aime

0.1

Hle

0.0

Terminalbench Hard

0.0

Lcr

0.0

Tau2

0.0

LLM Statsカテゴリスコア

Language

Legal

Finance

Healthcare

Code

Creativity

Writing

Math

Reasoning

Instruction Following

Physics

Structured Output

General

Biology

Chemistry

Factuality

価格設定

入力価格$0.125 / 1Mトークン

出力価格$0.5 / 1Mトークン

混合価格（3:1）$0.219 / 1Mトークン

速度

トークン/秒40.8

初トークン遅延0.47s

初回答遅延0.47s

プロバイダー価格ランキング

3 プロバイダー

最安: Microsoft最高: Azure

プロバイダー入力出力

1Microsoftプライマリ

$0.125

$0.5

2Azure Cognitive Services

$0.17

$0.68

3Azure

$0.17

$0.68

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク

LLM Stats Artificial Analysis

ドメイン	#順位	スコア	ソース
コーディングランキング	447	10.0	AA
総合ランキング	431	22.0	AA
数学的推論	267	30.0	AA
科学	320	35.0	AA