Перейти к основному содержанию

Phi-4

MicrosoftPhiOpen WeightMIT · Commercial OK

Описание

phi-4 is a state-of-the-art open model built to excel at advanced reasoning, coding, and knowledge tasks. It leverages a blend of synthetic data, filtered web data, academic texts, and supervised fine-tuning for precision, alignment, and safety.

Дата выхода
2024-12-12
Параметры
14.7B
Длина контекста
16K
Модальности
text

Радар способностей

28
general
17
coding
30
reasoning
36
scienceоцен.
0
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Code Ranking390
14.0
AA
General Ranking415
23.0
AA
Math Reasoning267
30.0
AA
Reasoning25
83.0
LS
Science295
36.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA56.1%Сам.

Code

HumanEval82.6%Сам.

Creativity

Arena Hard75.4%Сам.

Factuality

SimpleQA3.0%Сам.

Finance

MMLU84.8%Сам.
MMLU-Pro70.4%Сам.

General

IFEval63.0%Сам.
PhiBench56.2%Сам.
LiveBench47.6%Сам.

Math

MGSM80.6%Сам.
MATH80.4%Сам.
DROP75.5%Сам.

Reasoning

HumanEval+82.8%Сам.

Индексы оценки AA

Math Index
18.0
Coding Index
11.2
Intelligence Index
10.4
Math 500
0.8
Mmlu Pro
0.7
Gpqa
0.6
Scicode
0.3
Ifbench
0.2
Livecodebench
0.2
Aime 25
0.2
Aime
0.1
Hle
0.0
Terminalbench Hard
0.0
Lcr
0.0
Tau2
0.0

Оценки категорий LLM Stats

Writing
80
Code
80
Creativity
80
Finance
80
Healthcare
80
Language
80
Legal
80
Math
70
Reasoning
70
Structured Output
60
Biology
60
Chemistry
60
General
60
Instruction Following
60
Physics
60
Factuality
0

Цены

Цена ввода$0.125 / 1M tokens
Цена вывода$0.5 / 1M tokens
Смешанная цена (3:1)$0.219 / 1M tokens

Скорость

Токенов/сек38.5 tokens/s
Задержка первого токена0.51s
Время до первого ответа0.51s

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки