Перейти к основному содержанию

GPT-4.1 mini

OpenAIGPTProprietary

Описание

GPT-4.1 mini provides a balance between intelligence, speed, and cost. It's a significant leap in small model performance, even beating GPT-4o in many benchmarks while reducing latency and cost.

Дата выхода
2025-04-14
Параметры
Длина контекста
1.0M
Модальности
image, pdf, text

Радар способностей

33
general
47
coding
54
reasoning
45
scienceоцен.
50
agents
85
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Оценки бенчмарков (LLM Stats)

Biology

GPQA65.0%Сам.

Code

Aider-Polyglot34.7%Сам.
Aider-Polyglot Edit31.6%Сам.
SWE-Bench Verified23.6%Сам.

Communication

Multi-IF67.0%Сам.
TAU-bench Retail55.8%Сам.
TAU-bench Airline36.0%Сам.
Multi-Challenge35.8%Сам.

Finance

MMLU87.5%Сам.

General

IFEval84.1%Сам.
MMMLU78.5%Сам.
MMMU72.7%Сам.
Internal API instruction following (hard)45.1%Сам.

Language

COLLIE54.6%Сам.

Long Context

ComplexFuncBench49.3%Сам.
OpenAI-MRCR: 2 needle 128k47.2%Сам.
OpenAI-MRCR: 2 needle 1M33.3%Сам.
Graphwalks BFS >128k15.0%Сам.
Graphwalks parents >128k11.0%Сам.

Math

MathVista73.1%Сам.
AIME 202449.6%Сам.
AIME 202540.2%Сам.
HMMT 202535.0%Сам.
Humanity's Last Exam3.7%Сам.

Multimodal

CharXiv-D88.4%Сам.
CharXiv-R56.8%Сам.

Reasoning

Graphwalks BFS <128k61.7%Сам.
Graphwalks parents <128k60.5%Сам.

Индексы оценки AA

Math Index
46.3
Intelligence Index
16.3
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.7
Tau2
0.5
Livecodebench
0.5
Aime 25
0.5
Aime
0.4
Lcr
0.4
Scicode
0.4
Ifbench
0.4
Terminalbench Hard
0.1
Hle
0.0

Оценки категорий LLM Stats

Legal
90
Finance
90
Instruction Following
80
Healthcare
80
Language
70
Multimodal
70
Physics
70
Structured Output
70
Biology
70
Chemistry
70
General
60
Vision
60
Math
50
Reasoning
50
Communication
50
Tool Calling
50
Writing
50
Spatial Reasoning
40
Long Context
30
Code
30
Frontend Development
20

Цены

Цена ввода$0.4 / 1M токенов
Цена вывода$1.6 / 1M токенов
Смешанная цена (3:1)$0.7 / 1M токенов
Цена чтения кэша$0.1 / 1M токенов

Скорость

Токенов/сек98.8
Задержка первого токена0.52s
Время до первого ответа0.52s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

17 провайдеров

Самый дешевый: OpenAIСамый дорогой: Merge Gateway
ПровайдерВводВывод
1OpenAIСамый дешевый
$0
$0
2Poe
$0.36
$1.4
3Helicone
$0.4
$1.6
4302.AI
$0.4
$1.6
5NanoGPT
$0.4
$1.6
6Abacus
$0.4
$1.6
7OpenRouter
$0.4
$1.6
8Kilo Gateway
$0.4
$1.6
9SAP AI Core
$0.4
$1.6
10Azure Cognitive Services
$0.4
$1.6
11Requesty
$0.4
$1.6
12Vercel AI Gateway
$0.4
$1.6
13LLM Gateway
$0.4
$1.6
14Azure
$0.4
$1.6
15NEAR AI Cloud
$0.4
$1.6
16OrcaRouter
$0.4
$1.6
17Merge Gateway
$0.4
$1.6

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки