メインコンテンツへスキップ

GPT-4.1 mini

OpenAIGPTProprietary

説明

GPT-4.1 mini provides a balance between intelligence, speed, and cost. It's a significant leap in small model performance, even beating GPT-4o in many benchmarks while reducing latency and cost.

リリース日
2025-04-14
パラメータ
コンテキスト長
1.0M
モダリティ
file, image, text

能力レーダー

37
general
31
coding
54
reasoning
45
science推定
50
agents
85
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking229
37.0
AA
General Ranking207
49.0
AA
Math Reasoning161
56.0
AA
Multimodal Ranking49
75.0
LS
Reasoning61
62.0
LS
Science196
48.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA65.0%自己申告

Code

Aider-Polyglot34.7%自己申告
Aider-Polyglot Edit31.6%自己申告
SWE-Bench Verified23.6%自己申告

Communication

Multi-IF67.0%自己申告
TAU-bench Retail55.8%自己申告
TAU-bench Airline36.0%自己申告
Multi-Challenge35.8%自己申告

Finance

MMLU87.5%自己申告

General

IFEval84.1%自己申告
MMMLU78.5%自己申告
MMMU72.7%自己申告
Internal API instruction following (hard)45.1%自己申告

Language

COLLIE54.6%自己申告

Long Context

ComplexFuncBench49.3%自己申告
OpenAI-MRCR: 2 needle 128k47.2%自己申告
OpenAI-MRCR: 2 needle 1M33.3%自己申告
Graphwalks BFS >128k15.0%自己申告
Graphwalks parents >128k11.0%自己申告

Math

MathVista73.1%自己申告
AIME 202449.6%自己申告
AIME 202540.2%自己申告
HMMT 202535.0%自己申告
Humanity's Last Exam3.7%自己申告

Multimodal

CharXiv-D88.4%自己申告
CharXiv-R56.8%自己申告

Reasoning

Graphwalks BFS <128k61.7%自己申告
Graphwalks parents <128k60.5%自己申告

AA評価指数

Math Index
46.3
Intelligence Index
22.9
Coding Index
18.5
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.7
Tau2
0.5
Livecodebench
0.5
Aime 25
0.5
Aime
0.4
Lcr
0.4
Scicode
0.4
Ifbench
0.4
Terminalbench Hard
0.1
Hle
0.0

LLM Statsカテゴリスコア

Finance
90
Legal
90
Healthcare
80
Instruction Following
80
Structured Output
70
Biology
70
Chemistry
70
Language
70
Multimodal
70
Physics
70
Vision
60
General
60
Tool Calling
50
Writing
50
Communication
50
Math
50
Reasoning
50
Spatial Reasoning
40
Code
30
Long Context
30
Frontend Development
20

価格設定

入力価格$0.4 / 1M tokens
出力価格$1.6 / 1M tokens
混合価格(3:1)$0.7 / 1M tokens

速度

トークン/秒78.8 tokens/s
初トークン遅延0.52s
初回答遅延0.52s

利用可能なプロバイダー

(LS内部単位)
プロバイダー入力価格出力価格
OpenAI400K1.6M

外部リンク