GPT-4.1 mini
OpenAIGPTProprietary
説明
GPT-4.1 mini provides a balance between intelligence, speed, and cost. It's a significant leap in small model performance, even beating GPT-4o in many benchmarks while reducing latency and cost.
リリース日
2025-04-14
パラメータ
—
コンテキスト長
1.0M
モダリティ
file, image, text
能力レーダー
37
general
31
coding
54
reasoning
45
science推定
50
agents
85
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 229 | 37.0 | AA |
| General Ranking | 207 | 49.0 | AA |
| Math Reasoning | 161 | 56.0 | AA |
| Multimodal Ranking | 49 | 75.0 | LS |
| Reasoning | 61 | 62.0 | LS |
| Science | 196 | 48.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
65.0%自己申告
Code
Aider-Polyglot
34.7%自己申告
Aider-Polyglot Edit
31.6%自己申告
SWE-Bench Verified
23.6%自己申告
Communication
Multi-IF
67.0%自己申告
TAU-bench Retail
55.8%自己申告
TAU-bench Airline
36.0%自己申告
Multi-Challenge
35.8%自己申告
Finance
MMLU
87.5%自己申告
General
IFEval
84.1%自己申告
MMMLU
78.5%自己申告
MMMU
72.7%自己申告
Internal API instruction following (hard)
45.1%自己申告
Language
COLLIE
54.6%自己申告
Long Context
ComplexFuncBench
49.3%自己申告
OpenAI-MRCR: 2 needle 128k
47.2%自己申告
OpenAI-MRCR: 2 needle 1M
33.3%自己申告
Graphwalks BFS >128k
15.0%自己申告
Graphwalks parents >128k
11.0%自己申告
Math
MathVista
73.1%自己申告
AIME 2024
49.6%自己申告
AIME 2025
40.2%自己申告
HMMT 2025
35.0%自己申告
Humanity's Last Exam
3.7%自己申告
Multimodal
CharXiv-D
88.4%自己申告
CharXiv-R
56.8%自己申告
Reasoning
Graphwalks BFS <128k
61.7%自己申告
Graphwalks parents <128k
60.5%自己申告
AA評価指数
Math Index46.3
Intelligence Index22.9
Coding Index18.5
Math 5000.9
Mmlu Pro0.8
Gpqa0.7
Tau20.5
Livecodebench0.5
Aime 250.5
Aime0.4
Lcr0.4
Scicode0.4
Ifbench0.4
Terminalbench Hard0.1
Hle0.0
LLM Statsカテゴリスコア
Finance90
Legal90
Healthcare80
Instruction Following80
Structured Output70
Biology70
Chemistry70
Language70
Multimodal70
Physics70
Vision60
General60
Tool Calling50
Writing50
Communication50
Math50
Reasoning50
Spatial Reasoning40
Code30
Long Context30
Frontend Development20
価格設定
入力価格$0.4 / 1M tokens
出力価格$1.6 / 1M tokens
混合価格(3:1)$0.7 / 1M tokens
速度
トークン/秒78.8 tokens/s
初トークン遅延0.52s
初回答遅延0.52s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| OpenAI | 400K | 1.6M |