GPT-4.1 mini
OpenAIGPTProprietary
Описание
GPT-4.1 mini provides a balance between intelligence, speed, and cost. It's a significant leap in small model performance, even beating GPT-4o in many benchmarks while reducing latency and cost.
Дата выхода
2025-04-14
Параметры
—
Длина контекста
1.0M
Модальности
file, image, text
Радар способностей
37
general
31
coding
54
reasoning
45
scienceоцен.
50
agents
85
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 229 | 37.0 | AA |
| General Ranking | 207 | 49.0 | AA |
| Math Reasoning | 161 | 56.0 | AA |
| Multimodal Ranking | 49 | 75.0 | LS |
| Reasoning | 61 | 62.0 | LS |
| Science | 196 | 48.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
65.0%Сам.
Code
Aider-Polyglot
34.7%Сам.
Aider-Polyglot Edit
31.6%Сам.
SWE-Bench Verified
23.6%Сам.
Communication
Multi-IF
67.0%Сам.
TAU-bench Retail
55.8%Сам.
TAU-bench Airline
36.0%Сам.
Multi-Challenge
35.8%Сам.
Finance
MMLU
87.5%Сам.
General
IFEval
84.1%Сам.
MMMLU
78.5%Сам.
MMMU
72.7%Сам.
Internal API instruction following (hard)
45.1%Сам.
Language
COLLIE
54.6%Сам.
Long Context
ComplexFuncBench
49.3%Сам.
OpenAI-MRCR: 2 needle 128k
47.2%Сам.
OpenAI-MRCR: 2 needle 1M
33.3%Сам.
Graphwalks BFS >128k
15.0%Сам.
Graphwalks parents >128k
11.0%Сам.
Math
MathVista
73.1%Сам.
AIME 2024
49.6%Сам.
AIME 2025
40.2%Сам.
HMMT 2025
35.0%Сам.
Humanity's Last Exam
3.7%Сам.
Multimodal
CharXiv-D
88.4%Сам.
CharXiv-R
56.8%Сам.
Reasoning
Graphwalks BFS <128k
61.7%Сам.
Graphwalks parents <128k
60.5%Сам.
Индексы оценки AA
Math Index46.3
Intelligence Index22.9
Coding Index18.5
Math 5000.9
Mmlu Pro0.8
Gpqa0.7
Tau20.5
Livecodebench0.5
Aime 250.5
Aime0.4
Lcr0.4
Scicode0.4
Ifbench0.4
Terminalbench Hard0.1
Hle0.0
Оценки категорий LLM Stats
Finance90
Legal90
Healthcare80
Instruction Following80
Structured Output70
Biology70
Chemistry70
Language70
Multimodal70
Physics70
Vision60
General60
Tool Calling50
Writing50
Communication50
Math50
Reasoning50
Spatial Reasoning40
Code30
Long Context30
Frontend Development20
Цены
Цена ввода$0.4 / 1M tokens
Цена вывода$1.6 / 1M tokens
Смешанная цена (3:1)$0.7 / 1M tokens
Скорость
Токенов/сек78.8 tokens/s
Задержка первого токена0.52s
Время до первого ответа0.52s
Доступные провайдеры
(Внутренние единицы LS)| Провайдер | Цена ввода | Цена вывода |
|---|---|---|
| OpenAI | 400K | 1.6M |