Перейти к основному содержанию

GPT-4.1

OpenAIGPTProprietary

Описание

GPT-4.1 is OpenAI's latest and most advanced flagship model, significantly improving upon GPT-4 Turbo in performance across benchmarks, speed, and cost-effectiveness.

Дата выхода
2025-04-14
Параметры
Длина контекста
1.0M
Модальности
file, image, text

Радар способностей

39
general
32
coding
49
reasoning
44
scienceоцен.
60
agents
85
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Code Ranking177
45.0
AA
General Ranking181
52.0
AA
Math Reasoning188
48.0
AA
Multimodal Ranking53
74.0
LS
Reasoning63
60.0
LS
Science206
47.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA66.3%Сам.

Code

SWE-Bench Verified54.6%Сам.
Aider-Polyglot Edit52.9%Сам.
Aider-Polyglot51.6%Сам.

Communication

Multi-IF70.8%Сам.
TAU-bench Retail68.0%Сам.
TAU-bench Airline49.4%Сам.
Multi-Challenge38.3%Сам.

Finance

MMLU90.2%Сам.

General

IFEval87.4%Сам.
MMMLU87.3%Сам.
MMMU74.8%Сам.
Internal API instruction following (hard)49.1%Сам.

Language

COLLIE65.8%Сам.

Long Context

ComplexFuncBench65.5%Сам.
OpenAI-MRCR: 2 needle 128k57.2%Сам.
OpenAI-MRCR: 2 needle 1M46.3%Сам.
Graphwalks parents >128k25.0%Сам.
Graphwalks BFS >128k19.0%Сам.

Math

MathVista72.2%Сам.
AIME 202448.1%Сам.
AIME 202546.4%Сам.
HMMT 202528.9%Сам.
Humanity's Last Exam5.4%Сам.

Multimodal

CharXiv-D87.9%Сам.
Video-MME (long, no subtitles)72.0%Сам.
CharXiv-R56.7%Сам.

Reasoning

Graphwalks BFS <128k61.7%Сам.
Graphwalks parents <128k58.0%Сам.

Индексы оценки AA

Math Index
34.7
Intelligence Index
26.3
Coding Index
21.8
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.7
Lcr
0.6
Tau2
0.5
Livecodebench
0.5
Aime
0.4
Ifbench
0.4
Scicode
0.4
Aime 25
0.3
Terminalbench Hard
0.1
Hle
0.0

Оценки категорий LLM Stats

Finance
90
Legal
90
Healthcare
80
Instruction Following
80
Language
80
Structured Output
70
Writing
70
Biology
70
Chemistry
70
General
70
Multimodal
70
Physics
70
Tool Calling
60
Vision
60
Communication
60
Reasoning
60
Code
50
Frontend Development
50
Math
50
Spatial Reasoning
40
Long Context
40

Цены

Цена ввода$2 / 1M tokens
Цена вывода$8 / 1M tokens
Смешанная цена (3:1)$3.5 / 1M tokens

Скорость

Токенов/сек108.1 tokens/s
Задержка первого токена0.55s
Время до первого ответа0.55s

Доступные провайдеры

(Внутренние единицы LS)
ПровайдерЦена вводаЦена вывода
OpenAI2.0M8.0M

Внешние ссылки