Phi-4 Mini Instruct
MicrosoftPhiOpen WeightMIT · Commercial OK
Описание
Phi 4 Mini Instruct is a lightweight (3.8B parameters) open model built upon synthetic data and filtered web data, focusing on high-quality reasoning. It supports a 128K token context length and is enhanced for instruction adherence and safety via supervised fine-tuning and direct preference optimization.
Дата выхода
2024-02-26
Параметры
3.8B
Длина контекста
128K
Модальности
text
Радар способностей
19
general
7
coding
18
reasoning
20
scienceоцен.
0
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 427 | 9.0 | AA |
| General Ranking | 452 | 17.0 | AA |
| Math Reasoning | 310 | 18.0 | AA |
| Reasoning | 50 | 69.0 | LS |
| Science | 425 | 18.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
25.2%Сам.
Creativity
Social IQa
72.5%Сам.
Arena Hard
32.8%Сам.
Finance
MMLU
67.3%Сам.
TruthfulQA
66.4%Сам.
MMLU-Pro
52.8%Сам.
General
ARC-C
83.7%Сам.
OpenBookQA
79.2%Сам.
PIQA
77.6%Сам.
Multilingual MMLU
49.3%Сам.
Language
BoolQ
81.2%Сам.
BIG-Bench Hard
70.4%Сам.
Winogrande
67.0%Сам.
Math
GSM8k
88.6%Сам.
MATH
64.0%Сам.
MGSM
63.9%Сам.
Reasoning
HellaSwag
69.1%Сам.
Индексы оценки AA
Intelligence Index8.4
Math Index6.7
Coding Index3.6
Math 5000.7
Mmlu Pro0.5
Gpqa0.3
Ifbench0.2
Lcr0.1
Livecodebench0.1
Scicode0.1
Tau20.1
Aime 250.1
Hle0.0
Aime0.0
Terminalbench Hard0.0
Оценки категорий LLM Stats
Math70
Psychology70
Reasoning70
Finance60
General60
Healthcare60
Language60
Legal60
Creativity50
Physics50
Writing30
Biology30
Chemistry30
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек44.6 tokens/s
Задержка первого токена0.33s
Время до первого ответа0.33s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров