Phi-4 Mini Instruct

MicrosoftPhiОткрытые весаMIT · Коммерческое использование

Описание

Phi 4 Mini Instruct is a lightweight (3.8B parameters) open model built upon synthetic data and filtered web data, focusing on high-quality reasoning. It supports a 128K token context length and is enhanced for instruction adherence and safety via supervised fine-tuning and direct preference optimization.

Дата выхода

2024-02-26

Параметры

3.8B

Длина контекста

128K

Модальности

text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	435	11.0	AA
Общий рейтинг	481	15.0	AA
Математическое мышление	310	18.0	AA
Рассуждения	54	69.0	LS
Наука	452	17.0	AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA

25.2%Сам.

Creativity

Social IQa

72.5%Сам.

Arena Hard

32.8%Сам.

Finance

MMLU

67.3%Сам.

TruthfulQA

66.4%Сам.

MMLU-Pro

52.8%Сам.

General

ARC-C

83.7%Сам.

OpenBookQA

79.2%Сам.

PIQA

77.6%Сам.

Multilingual MMLU

49.3%Сам.

Language

BoolQ

81.2%Сам.

BIG-Bench Hard

70.4%Сам.

Winogrande

67.0%Сам.

Math

GSM8k

88.6%Сам.

MATH

64.0%Сам.

MGSM

63.9%Сам.

Reasoning

HellaSwag

69.1%Сам.

Индексы оценки AA

Math Index

6.7

Intelligence Index

3.0

Math 500

0.7

Mmlu Pro

0.5

Gpqa

0.3

Ifbench

0.2

Lcr

0.1

Livecodebench

0.1

Scicode

0.1

Tau2

0.1

Aime 25

0.1

Hle

0.0

Aime

0.0

Terminalbench Hard

0.0

Оценки категорий LLM Stats

Math

Psychology

Reasoning

Language

Legal

Finance

General

Healthcare

Physics

Creativity

Biology

Chemistry

Writing

Цены

Цена вводаБесплатно

Цена выводаБесплатно

Смешанная цена (3:1)Бесплатно

Цена чтения кэша$0.08 / 1M токенов

Скорость

Токенов/сек46.2

Задержка первого токена0.40s

Время до первого ответа0.40s

Рейтинг цен провайдеров

4 провайдеров

Самый дешевый: Azure Cognitive ServicesСамый дорогой: NanoGPT

ПровайдерВводВывод

1Azure Cognitive ServicesСамый дешевый

$0.075

$0.3

2Azure

$0.075

$0.3

3Weights & Biases

$0.08

$0.35

4NanoGPT

$0.17

$0.68

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis