GPT-4.1
OpenAIGPTProprietary
Описание
GPT-4.1 is OpenAI's latest and most advanced flagship model, significantly improving upon GPT-4 Turbo in performance across benchmarks, speed, and cost-effectiveness.
Дата выхода
2025-04-14
Параметры
—
Длина контекста
1.0M
Модальности
image, pdf, text
Радар способностей
36
general
44
coding
49
reasoning
44
scienceоцен.
60
agents
85
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 177 | 51.0 | AA |
| Общий рейтинг | 206 | 48.0 | AA |
| Математическое мышление | 188 | 48.0 | AA |
| Мультимодальный рейтинг | 58 | 74.0 | LS |
| Рассуждения | 67 | 60.0 | LS |
| Наука | 227 | 46.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
66.3%Сам.
Code
SWE-Bench Verified
54.6%Сам.
Aider-Polyglot Edit
52.9%Сам.
Aider-Polyglot
51.6%Сам.
Communication
Multi-IF
70.8%Сам.
TAU-bench Retail
68.0%Сам.
TAU-bench Airline
49.4%Сам.
Multi-Challenge
38.3%Сам.
Finance
MMLU
90.2%Сам.
General
IFEval
87.4%Сам.
MMMLU
87.3%Сам.
MMMU
74.8%Сам.
Internal API instruction following (hard)
49.1%Сам.
Language
COLLIE
65.8%Сам.
Long Context
ComplexFuncBench
65.5%Сам.
OpenAI-MRCR: 2 needle 128k
57.2%Сам.
OpenAI-MRCR: 2 needle 1M
46.3%Сам.
Graphwalks parents >128k
25.0%Сам.
Graphwalks BFS >128k
19.0%Сам.
Math
MathVista
72.2%Сам.
AIME 2024
48.1%Сам.
AIME 2025
46.4%Сам.
HMMT 2025
28.9%Сам.
Humanity's Last Exam
5.4%Сам.
Multimodal
CharXiv-D
87.9%Сам.
Video-MME (long, no subtitles)
72.0%Сам.
CharXiv-R
56.7%Сам.
Reasoning
Graphwalks BFS <128k
61.7%Сам.
Graphwalks parents <128k
58.0%Сам.
Индексы оценки AA
Math Index34.7
Intelligence Index19.4
Math 5000.9
Mmlu Pro0.8
Gpqa0.7
Lcr0.6
Tau20.5
Livecodebench0.5
Aime0.4
Ifbench0.4
Scicode0.4
Aime 250.3
Terminalbench Hard0.1
Hle0.0
Оценки категорий LLM Stats
Legal90
Finance90
Instruction Following80
Language80
Healthcare80
Multimodal70
Physics70
Structured Output70
General70
Biology70
Chemistry70
Writing70
Reasoning60
Communication60
Tool Calling60
Vision60
Math50
Frontend Development50
Code50
Long Context40
Spatial Reasoning40
Цены
Цена ввода$2 / 1M токенов
Цена вывода$8 / 1M токенов
Смешанная цена (3:1)$3.5 / 1M токенов
Цена чтения кэша$0.5 / 1M токенов
Скорость
Токенов/сек146.3
Задержка первого токена0.59s
Время до первого ответа0.59s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
20 провайдеров
Самый дешевый: OpenAIСамый дорогой: Cortecs
ПровайдерВводВывод
1OpenAIСамый дешевый
$0
$0.00001
2Poe
$1.8
$7.2
3302.AI
$2
$8
4NanoGPT
$2
$8
5Abacus
$2
$8
6OpenRouter
$2
$8
7Kilo Gateway
$2
$8
8SAP AI Core
$2
$8
9GitHub Copilot
$2
$8
10Helicone
$2
$8
11Azure Cognitive Services
$2
$8
12Requesty
$2
$8
13Vercel AI Gateway
$2
$8
14LLM Gateway
$2
$8
15Azure
$2
$8
16FastRouter
$2
$8
17NEAR AI Cloud
$2
$8
18OrcaRouter
$2
$8
19Merge Gateway
$2
$8
20Cortecs
$2.354
$9.417
Сравнение цен разных API-провайдеров для этой модели.