Phi-4 Mini Instruct
MicrosoftPhiОткрытые весаMIT · Коммерческое использование
Описание
Phi 4 Mini Instruct is a lightweight (3.8B parameters) open model built upon synthetic data and filtered web data, focusing on high-quality reasoning. It supports a 128K token context length and is enhanced for instruction adherence and safety via supervised fine-tuning and direct preference optimization.
Дата выхода
2024-02-26
Параметры
3.8B
Длина контекста
128K
Модальности
text
Радар способностей
16
general
12
coding
18
reasoning
20
scienceоцен.
16
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 435 | 11.0 | AA |
| Общий рейтинг | 481 | 15.0 | AA |
| Математическое мышление | 310 | 18.0 | AA |
| Рассуждения | 54 | 69.0 | LS |
| Наука | 452 | 17.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
25.2%Сам.
Creativity
Social IQa
72.5%Сам.
Arena Hard
32.8%Сам.
Finance
MMLU
67.3%Сам.
TruthfulQA
66.4%Сам.
MMLU-Pro
52.8%Сам.
General
ARC-C
83.7%Сам.
OpenBookQA
79.2%Сам.
PIQA
77.6%Сам.
Multilingual MMLU
49.3%Сам.
Language
BoolQ
81.2%Сам.
BIG-Bench Hard
70.4%Сам.
Winogrande
67.0%Сам.
Math
GSM8k
88.6%Сам.
MATH
64.0%Сам.
MGSM
63.9%Сам.
Reasoning
HellaSwag
69.1%Сам.
Индексы оценки AA
Math Index6.7
Intelligence Index3.0
Math 5000.7
Mmlu Pro0.5
Gpqa0.3
Ifbench0.2
Lcr0.1
Livecodebench0.1
Scicode0.1
Tau20.1
Aime 250.1
Hle0.0
Aime0.0
Terminalbench Hard0.0
Оценки категорий LLM Stats
Math70
Psychology70
Reasoning70
Language60
Legal60
Finance60
General60
Healthcare60
Physics50
Creativity50
Biology30
Chemistry30
Writing30
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Цена чтения кэша$0.08 / 1M токенов
Скорость
Токенов/сек46.2
Задержка первого токена0.40s
Время до первого ответа0.40s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
4 провайдеров
Самый дешевый: Azure Cognitive ServicesСамый дорогой: NanoGPT
ПровайдерВводВывод
1Azure Cognitive ServicesСамый дешевый
$0.075
$0.3
2Azure
$0.075
$0.3
3Weights & Biases
$0.08
$0.35
4NanoGPT
$0.17
$0.68
Сравнение цен разных API-провайдеров для этой модели.