GPT-4.1 mini
OpenAIGPTProprietary
Описание
GPT-4.1 mini provides a balance between intelligence, speed, and cost. It's a significant leap in small model performance, even beating GPT-4o in many benchmarks while reducing latency and cost.
Дата выхода
2025-04-14
Параметры
—
Длина контекста
1.0M
Модальности
image, pdf, text
Радар способностей
33
general
47
coding
54
reasoning
45
scienceоцен.
50
agents
85
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 244 | 40.0 | AA |
| Общий рейтинг | 222 | 46.0 | AA |
| Математическое мышление | 160 | 56.0 | AA |
| Мультимодальный рейтинг | 54 | 75.0 | LS |
| Рассуждения | 65 | 62.0 | LS |
| Наука | 215 | 47.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
65.0%Сам.
Code
Aider-Polyglot
34.7%Сам.
Aider-Polyglot Edit
31.6%Сам.
SWE-Bench Verified
23.6%Сам.
Communication
Multi-IF
67.0%Сам.
TAU-bench Retail
55.8%Сам.
TAU-bench Airline
36.0%Сам.
Multi-Challenge
35.8%Сам.
Finance
MMLU
87.5%Сам.
General
IFEval
84.1%Сам.
MMMLU
78.5%Сам.
MMMU
72.7%Сам.
Internal API instruction following (hard)
45.1%Сам.
Language
COLLIE
54.6%Сам.
Long Context
ComplexFuncBench
49.3%Сам.
OpenAI-MRCR: 2 needle 128k
47.2%Сам.
OpenAI-MRCR: 2 needle 1M
33.3%Сам.
Graphwalks BFS >128k
15.0%Сам.
Graphwalks parents >128k
11.0%Сам.
Math
MathVista
73.1%Сам.
AIME 2024
49.6%Сам.
AIME 2025
40.2%Сам.
HMMT 2025
35.0%Сам.
Humanity's Last Exam
3.7%Сам.
Multimodal
CharXiv-D
88.4%Сам.
CharXiv-R
56.8%Сам.
Reasoning
Graphwalks BFS <128k
61.7%Сам.
Graphwalks parents <128k
60.5%Сам.
Индексы оценки AA
Math Index46.3
Intelligence Index16.3
Math 5000.9
Mmlu Pro0.8
Gpqa0.7
Tau20.5
Livecodebench0.5
Aime 250.5
Aime0.4
Lcr0.4
Scicode0.4
Ifbench0.4
Terminalbench Hard0.1
Hle0.0
Оценки категорий LLM Stats
Legal90
Finance90
Instruction Following80
Healthcare80
Language70
Multimodal70
Physics70
Structured Output70
Biology70
Chemistry70
General60
Vision60
Math50
Reasoning50
Communication50
Tool Calling50
Writing50
Spatial Reasoning40
Long Context30
Code30
Frontend Development20
Цены
Цена ввода$0.4 / 1M токенов
Цена вывода$1.6 / 1M токенов
Смешанная цена (3:1)$0.7 / 1M токенов
Цена чтения кэша$0.1 / 1M токенов
Скорость
Токенов/сек98.8
Задержка первого токена0.52s
Время до первого ответа0.52s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
17 провайдеров
Самый дешевый: OpenAIСамый дорогой: Merge Gateway
ПровайдерВводВывод
1OpenAIСамый дешевый
$0
$0
2Poe
$0.36
$1.4
3Helicone
$0.4
$1.6
4302.AI
$0.4
$1.6
5NanoGPT
$0.4
$1.6
6Abacus
$0.4
$1.6
7OpenRouter
$0.4
$1.6
8Kilo Gateway
$0.4
$1.6
9SAP AI Core
$0.4
$1.6
10Azure Cognitive Services
$0.4
$1.6
11Requesty
$0.4
$1.6
12Vercel AI Gateway
$0.4
$1.6
13LLM Gateway
$0.4
$1.6
14Azure
$0.4
$1.6
15NEAR AI Cloud
$0.4
$1.6
16OrcaRouter
$0.4
$1.6
17Merge Gateway
$0.4
$1.6
Сравнение цен разных API-провайдеров для этой модели.