Phi-3 Mini Instruct 3.8B
MicrosoftPhi
Дата выхода
2024-04-23
Параметры
—
Длина контекста
16K
Модальности
text
Радар способностей
16
general
11
coding
11
reasoning
18
scienceоцен.
11
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 472 | 5.0 | AA |
| Общий рейтинг | 483 | 15.0 | AA |
| Математическое мышление | 338 | 9.0 | AA |
| Рассуждения | 27 | 83.0 | LS |
| Наука | 466 | 16.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
56.1%Сам.
Code
HumanEval
82.6%Сам.
Creativity
Arena Hard
75.4%Сам.
Factuality
SimpleQA
3.0%Сам.
Finance
MMLU
84.8%Сам.
MMLU-Pro
70.4%Сам.
General
IFEval
63.0%Сам.
PhiBench
56.2%Сам.
LiveBench
47.6%Сам.
Math
MGSM
80.6%Сам.
MATH
80.4%Сам.
DROP
75.5%Сам.
Reasoning
HumanEval+
82.8%Сам.
Индексы оценки AA
Intelligence Index4.6
Math 5000.5
Mmlu Pro0.4
Gpqa0.3
Math Index0.3
Ifbench0.2
Livecodebench0.1
Scicode0.1
Hle0.0
Aime0.0
Lcr0.0
Aime 250.0
Terminalbench Hard0.0
Tau20.0
Оценки категорий LLM Stats
Language80
Legal80
Finance80
Healthcare80
Code80
Creativity80
Writing80
Math70
Reasoning70
Instruction Following60
Physics60
Structured Output60
General60
Biology60
Chemistry60
Factuality0
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
4 провайдеров
Самый дешевый: Kilo GatewayСамый дорогой: Azure
ПровайдерВводВывод
1Kilo GatewayСамый дешевый
$0.06
$0.14
2OpenRouter
$0.065
$0.14
3Azure Cognitive Services
$0.13
$0.52
4Azure
$0.13
$0.52
Сравнение цен разных API-провайдеров для этой модели.