Phi-4 Mini Instruct

MicrosoftPhiओपन वेटMIT · व्यावसायिक उपयोग

विवरण

Phi 4 Mini Instruct is a lightweight (3.8B parameters) open model built upon synthetic data and filtered web data, focusing on high-quality reasoning. It supports a 128K token context length and is enhanced for instruction adherence and safety via supervised fine-tuning and direct preference optimization.

रिलीज़ तिथि

2024-02-26

पैरामीटर

3.8B

संदर्भ लंबाई

128K

मोडैलिटीज़

text

क्षमता रडार

general

coding

reasoning

scienceअनुमानित

agents

multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन	#रैंक	स्कोर	स्रोत
कोडिंग रैंकिंग	435	11.0	AA
सामान्य रैंकिंग	481	15.0	AA
गणितीय तर्क	310	18.0	AA
तर्क	54	69.0	LS
विज्ञान	452	17.0	AA

बेंचमार्क स्कोर (LLM Stats)

Biology

GPQA

25.2%स्वयं

Creativity

Social IQa

72.5%स्वयं

Arena Hard

32.8%स्वयं

Finance

MMLU

67.3%स्वयं

TruthfulQA

66.4%स्वयं

MMLU-Pro

52.8%स्वयं

General

ARC-C

83.7%स्वयं

OpenBookQA

79.2%स्वयं

PIQA

77.6%स्वयं

Multilingual MMLU

49.3%स्वयं

Language

BoolQ

81.2%स्वयं

BIG-Bench Hard

70.4%स्वयं

Winogrande

67.0%स्वयं

Math

GSM8k

88.6%स्वयं

MATH

64.0%स्वयं

MGSM

63.9%स्वयं

Reasoning

HellaSwag

69.1%स्वयं

AA मूल्यांकन सूचकांक

Math Index

6.7

Intelligence Index

3.0

Math 500

0.7

Mmlu Pro

0.5

Gpqa

0.3

Ifbench

0.2

Lcr

0.1

Livecodebench

0.1

Scicode

0.1

Tau2

0.1

Aime 25

0.1

Hle

0.0

Aime

0.0

Terminalbench Hard

0.0

LLM Stats श्रेणी स्कोर

Math

Psychology

Reasoning

Language

Legal

Finance

General

Healthcare

Physics

Creativity

Biology

Chemistry

Writing

मूल्य निर्धारण

इनपुट मूल्यमुफ्त

आउटपुट मूल्यमुफ्त

मिश्रित मूल्य (3:1)मुफ्त

कैश पठन मूल्य$0.08 / 1M टोकन

गति

टोकन/सेकंड46.2

पहले टोकन में देरी0.40s

पहले उत्तर में देरी0.40s

प्रदाता मूल्य रैंकिंग

4 प्रदाता

सबसे सस्ता: Azure Cognitive Servicesसबसे महंगा: NanoGPT

प्रदाताइनपुटआउटपुट

1Azure Cognitive Servicesसबसे सस्ता

$0.075

$0.3

2Azure

$0.075

$0.3

3Weights & Biases

$0.08

$0.35

4NanoGPT

$0.17

$0.68

इस मॉडल के लिए विभिन्न API प्रदाताओं के मूल्य निर्धारण की तुलना करें।

बाहरी लिंक

LLM Stats Artificial Analysis