Перейти к основному содержанию

Phi-3 Mini Instruct 3.8B

MicrosoftPhi
Дата выхода
2024-04-23
Параметры
Длина контекста
16K
Модальности
text

Радар способностей

16
general
11
coding
11
reasoning
18
scienceоцен.
11
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга472
5.0
AA
Общий рейтинг483
15.0
AA
Математическое мышление338
9.0
AA
Рассуждения27
83.0
LS
Наука466
16.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA56.1%Сам.

Code

HumanEval82.6%Сам.

Creativity

Arena Hard75.4%Сам.

Factuality

SimpleQA3.0%Сам.

Finance

MMLU84.8%Сам.
MMLU-Pro70.4%Сам.

General

IFEval63.0%Сам.
PhiBench56.2%Сам.
LiveBench47.6%Сам.

Math

MGSM80.6%Сам.
MATH80.4%Сам.
DROP75.5%Сам.

Reasoning

HumanEval+82.8%Сам.

Индексы оценки AA

Intelligence Index
4.6
Math 500
0.5
Mmlu Pro
0.4
Gpqa
0.3
Math Index
0.3
Ifbench
0.2
Livecodebench
0.1
Scicode
0.1
Hle
0.0
Aime
0.0
Lcr
0.0
Aime 25
0.0
Terminalbench Hard
0.0
Tau2
0.0

Оценки категорий LLM Stats

Language
80
Legal
80
Finance
80
Healthcare
80
Code
80
Creativity
80
Writing
80
Math
70
Reasoning
70
Instruction Following
60
Physics
60
Structured Output
60
General
60
Biology
60
Chemistry
60
Factuality
0

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

4 провайдеров

Самый дешевый: Kilo GatewayСамый дорогой: Azure
ПровайдерВводВывод
1Kilo GatewayСамый дешевый
$0.06
$0.14
2OpenRouter
$0.065
$0.14
3Azure Cognitive Services
$0.13
$0.52
4Azure
$0.13
$0.52

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки