Перейти к основному содержанию

GPT-4.1

OpenAIGPTProprietary

Описание

GPT-4.1 is OpenAI's latest and most advanced flagship model, significantly improving upon GPT-4 Turbo in performance across benchmarks, speed, and cost-effectiveness.

Дата выхода
2025-04-14
Параметры
Длина контекста
1.0M
Модальности
image, pdf, text

Радар способностей

36
general
44
coding
49
reasoning
44
scienceоцен.
60
agents
85
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Оценки бенчмарков (LLM Stats)

Biology

GPQA66.3%Сам.

Code

SWE-Bench Verified54.6%Сам.
Aider-Polyglot Edit52.9%Сам.
Aider-Polyglot51.6%Сам.

Communication

Multi-IF70.8%Сам.
TAU-bench Retail68.0%Сам.
TAU-bench Airline49.4%Сам.
Multi-Challenge38.3%Сам.

Finance

MMLU90.2%Сам.

General

IFEval87.4%Сам.
MMMLU87.3%Сам.
MMMU74.8%Сам.
Internal API instruction following (hard)49.1%Сам.

Language

COLLIE65.8%Сам.

Long Context

ComplexFuncBench65.5%Сам.
OpenAI-MRCR: 2 needle 128k57.2%Сам.
OpenAI-MRCR: 2 needle 1M46.3%Сам.
Graphwalks parents >128k25.0%Сам.
Graphwalks BFS >128k19.0%Сам.

Math

MathVista72.2%Сам.
AIME 202448.1%Сам.
AIME 202546.4%Сам.
HMMT 202528.9%Сам.
Humanity's Last Exam5.4%Сам.

Multimodal

CharXiv-D87.9%Сам.
Video-MME (long, no subtitles)72.0%Сам.
CharXiv-R56.7%Сам.

Reasoning

Graphwalks BFS <128k61.7%Сам.
Graphwalks parents <128k58.0%Сам.

Индексы оценки AA

Math Index
34.7
Intelligence Index
19.4
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.7
Lcr
0.6
Tau2
0.5
Livecodebench
0.5
Aime
0.4
Ifbench
0.4
Scicode
0.4
Aime 25
0.3
Terminalbench Hard
0.1
Hle
0.0

Оценки категорий LLM Stats

Legal
90
Finance
90
Instruction Following
80
Language
80
Healthcare
80
Multimodal
70
Physics
70
Structured Output
70
General
70
Biology
70
Chemistry
70
Writing
70
Reasoning
60
Communication
60
Tool Calling
60
Vision
60
Math
50
Frontend Development
50
Code
50
Long Context
40
Spatial Reasoning
40

Цены

Цена ввода$2 / 1M токенов
Цена вывода$8 / 1M токенов
Смешанная цена (3:1)$3.5 / 1M токенов
Цена чтения кэша$0.5 / 1M токенов

Скорость

Токенов/сек146.3
Задержка первого токена0.59s
Время до первого ответа0.59s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

20 провайдеров

Самый дешевый: OpenAIСамый дорогой: Cortecs
ПровайдерВводВывод
1OpenAIСамый дешевый
$0
$0.00001
2Poe
$1.8
$7.2
3302.AI
$2
$8
4NanoGPT
$2
$8
5Abacus
$2
$8
6OpenRouter
$2
$8
7Kilo Gateway
$2
$8
8SAP AI Core
$2
$8
9GitHub Copilot
$2
$8
10Helicone
$2
$8
11Azure Cognitive Services
$2
$8
12Requesty
$2
$8
13Vercel AI Gateway
$2
$8
14LLM Gateway
$2
$8
15Azure
$2
$8
16FastRouter
$2
$8
17NEAR AI Cloud
$2
$8
18OrcaRouter
$2
$8
19Merge Gateway
$2
$8
20Cortecs
$2.354
$9.417

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки