GPT-4.1
OpenAIGPTProprietary
Описание
GPT-4.1 is OpenAI's latest and most advanced flagship model, significantly improving upon GPT-4 Turbo in performance across benchmarks, speed, and cost-effectiveness.
Дата выхода
2025-04-14
Параметры
—
Длина контекста
1.0M
Модальности
file, image, text
Радар способностей
39
general
32
coding
49
reasoning
44
scienceоцен.
60
agents
85
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 177 | 45.0 | AA |
| General Ranking | 181 | 52.0 | AA |
| Math Reasoning | 188 | 48.0 | AA |
| Multimodal Ranking | 53 | 74.0 | LS |
| Reasoning | 63 | 60.0 | LS |
| Science | 206 | 47.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
66.3%Сам.
Code
SWE-Bench Verified
54.6%Сам.
Aider-Polyglot Edit
52.9%Сам.
Aider-Polyglot
51.6%Сам.
Communication
Multi-IF
70.8%Сам.
TAU-bench Retail
68.0%Сам.
TAU-bench Airline
49.4%Сам.
Multi-Challenge
38.3%Сам.
Finance
MMLU
90.2%Сам.
General
IFEval
87.4%Сам.
MMMLU
87.3%Сам.
MMMU
74.8%Сам.
Internal API instruction following (hard)
49.1%Сам.
Language
COLLIE
65.8%Сам.
Long Context
ComplexFuncBench
65.5%Сам.
OpenAI-MRCR: 2 needle 128k
57.2%Сам.
OpenAI-MRCR: 2 needle 1M
46.3%Сам.
Graphwalks parents >128k
25.0%Сам.
Graphwalks BFS >128k
19.0%Сам.
Math
MathVista
72.2%Сам.
AIME 2024
48.1%Сам.
AIME 2025
46.4%Сам.
HMMT 2025
28.9%Сам.
Humanity's Last Exam
5.4%Сам.
Multimodal
CharXiv-D
87.9%Сам.
Video-MME (long, no subtitles)
72.0%Сам.
CharXiv-R
56.7%Сам.
Reasoning
Graphwalks BFS <128k
61.7%Сам.
Graphwalks parents <128k
58.0%Сам.
Индексы оценки AA
Math Index34.7
Intelligence Index26.3
Coding Index21.8
Math 5000.9
Mmlu Pro0.8
Gpqa0.7
Lcr0.6
Tau20.5
Livecodebench0.5
Aime0.4
Ifbench0.4
Scicode0.4
Aime 250.3
Terminalbench Hard0.1
Hle0.0
Оценки категорий LLM Stats
Finance90
Legal90
Healthcare80
Instruction Following80
Language80
Structured Output70
Writing70
Biology70
Chemistry70
General70
Multimodal70
Physics70
Tool Calling60
Vision60
Communication60
Reasoning60
Code50
Frontend Development50
Math50
Spatial Reasoning40
Long Context40
Цены
Цена ввода$2 / 1M tokens
Цена вывода$8 / 1M tokens
Смешанная цена (3:1)$3.5 / 1M tokens
Скорость
Токенов/сек108.1 tokens/s
Задержка первого токена0.55s
Время до первого ответа0.55s
Доступные провайдеры
(Внутренние единицы LS)| Провайдер | Цена ввода | Цена вывода |
|---|---|---|
| OpenAI | 2.0M | 8.0M |