Passer au contenu principal

GPT-4.1 mini

OpenAIGPTProprietary

Description

GPT-4.1 mini provides a balance between intelligence, speed, and cost. It's a significant leap in small model performance, even beating GPT-4o in many benchmarks while reducing latency and cost.

Date de sortie
2025-04-14
Paramètres
Longueur du contexte
1.0M
Modalités
image, pdf, text

Radar de capacités

33
general
47
coding
54
reasoning
45
scienceest.
50
agents
85
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement codage244
40.0
AA
Classement général222
46.0
AA
Raisonnement mathématique160
56.0
AA
Classement multimodal54
75.0
LS
Raisonnement65
62.0
LS
Science215
47.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA65.0%Aut.

Code

Aider-Polyglot34.7%Aut.
Aider-Polyglot Edit31.6%Aut.
SWE-Bench Verified23.6%Aut.

Communication

Multi-IF67.0%Aut.
TAU-bench Retail55.8%Aut.
TAU-bench Airline36.0%Aut.
Multi-Challenge35.8%Aut.

Finance

MMLU87.5%Aut.

General

IFEval84.1%Aut.
MMMLU78.5%Aut.
MMMU72.7%Aut.
Internal API instruction following (hard)45.1%Aut.

Language

COLLIE54.6%Aut.

Long Context

ComplexFuncBench49.3%Aut.
OpenAI-MRCR: 2 needle 128k47.2%Aut.
OpenAI-MRCR: 2 needle 1M33.3%Aut.
Graphwalks BFS >128k15.0%Aut.
Graphwalks parents >128k11.0%Aut.

Math

MathVista73.1%Aut.
AIME 202449.6%Aut.
AIME 202540.2%Aut.
HMMT 202535.0%Aut.
Humanity's Last Exam3.7%Aut.

Multimodal

CharXiv-D88.4%Aut.
CharXiv-R56.8%Aut.

Reasoning

Graphwalks BFS <128k61.7%Aut.
Graphwalks parents <128k60.5%Aut.

Indices d'évaluation AA

Math Index
46.3
Intelligence Index
16.3
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.7
Tau2
0.5
Livecodebench
0.5
Aime 25
0.5
Aime
0.4
Lcr
0.4
Scicode
0.4
Ifbench
0.4
Terminalbench Hard
0.1
Hle
0.0

Scores par catégorie LLM Stats

Legal
90
Finance
90
Instruction Following
80
Healthcare
80
Language
70
Multimodal
70
Physics
70
Structured Output
70
Biology
70
Chemistry
70
General
60
Vision
60
Math
50
Reasoning
50
Communication
50
Tool Calling
50
Writing
50
Spatial Reasoning
40
Long Context
30
Code
30
Frontend Development
20

Tarification

Prix d'entrée$0.4 / 1M tokens
Prix de sortie$1.6 / 1M tokens
Prix mixte (3:1)$0.7 / 1M tokens
Prix de lecture cache$0.1 / 1M tokens

Vitesse

Tokens/sec98.8
Délai du premier token0.52s
Temps de réponse0.52s

Classement des Prix par Fournisseur

Classement des Prix par Fournisseur

17 fournisseurs

Moins cher: OpenAIPlus cher: Merge Gateway
FournisseurEntréeSortie
1OpenAIMoins cher
$0
$0
2Poe
$0.36
$1.4
3Helicone
$0.4
$1.6
4302.AI
$0.4
$1.6
5NanoGPT
$0.4
$1.6
6Abacus
$0.4
$1.6
7OpenRouter
$0.4
$1.6
8Kilo Gateway
$0.4
$1.6
9SAP AI Core
$0.4
$1.6
10Azure Cognitive Services
$0.4
$1.6
11Requesty
$0.4
$1.6
12Vercel AI Gateway
$0.4
$1.6
13LLM Gateway
$0.4
$1.6
14Azure
$0.4
$1.6
15NEAR AI Cloud
$0.4
$1.6
16OrcaRouter
$0.4
$1.6
17Merge Gateway
$0.4
$1.6

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes