GPT-4.1 mini
OpenAIGPTProprietary
विवरण
GPT-4.1 mini provides a balance between intelligence, speed, and cost. It's a significant leap in small model performance, even beating GPT-4o in many benchmarks while reducing latency and cost.
रिलीज़ तिथि
2025-04-14
पैरामीटर
—
संदर्भ लंबाई
1.0M
मोडैलिटीज़
file, image, text
क्षमता रडार
37
general
31
coding
54
reasoning
45
scienceअनुमानित
50
agents
85
multimodal
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| Code Ranking | 229 | 37.0 | AA |
| General Ranking | 207 | 49.0 | AA |
| Math Reasoning | 161 | 56.0 | AA |
| Multimodal Ranking | 49 | 75.0 | LS |
| Reasoning | 61 | 62.0 | LS |
| Science | 196 | 48.0 | AA |
बेंचमार्क स्कोर (LLM Stats)
Biology
GPQA
65.0%स्वयं
Code
Aider-Polyglot
34.7%स्वयं
Aider-Polyglot Edit
31.6%स्वयं
SWE-Bench Verified
23.6%स्वयं
Communication
Multi-IF
67.0%स्वयं
TAU-bench Retail
55.8%स्वयं
TAU-bench Airline
36.0%स्वयं
Multi-Challenge
35.8%स्वयं
Finance
MMLU
87.5%स्वयं
General
IFEval
84.1%स्वयं
MMMLU
78.5%स्वयं
MMMU
72.7%स्वयं
Internal API instruction following (hard)
45.1%स्वयं
Language
COLLIE
54.6%स्वयं
Long Context
ComplexFuncBench
49.3%स्वयं
OpenAI-MRCR: 2 needle 128k
47.2%स्वयं
OpenAI-MRCR: 2 needle 1M
33.3%स्वयं
Graphwalks BFS >128k
15.0%स्वयं
Graphwalks parents >128k
11.0%स्वयं
Math
MathVista
73.1%स्वयं
AIME 2024
49.6%स्वयं
AIME 2025
40.2%स्वयं
HMMT 2025
35.0%स्वयं
Humanity's Last Exam
3.7%स्वयं
Multimodal
CharXiv-D
88.4%स्वयं
CharXiv-R
56.8%स्वयं
Reasoning
Graphwalks BFS <128k
61.7%स्वयं
Graphwalks parents <128k
60.5%स्वयं
AA मूल्यांकन सूचकांक
Math Index46.3
Intelligence Index22.9
Coding Index18.5
Math 5000.9
Mmlu Pro0.8
Gpqa0.7
Tau20.5
Livecodebench0.5
Aime 250.5
Aime0.4
Lcr0.4
Scicode0.4
Ifbench0.4
Terminalbench Hard0.1
Hle0.0
LLM Stats श्रेणी स्कोर
Finance90
Legal90
Healthcare80
Instruction Following80
Structured Output70
Biology70
Chemistry70
Language70
Multimodal70
Physics70
Vision60
General60
Tool Calling50
Writing50
Communication50
Math50
Reasoning50
Spatial Reasoning40
Code30
Long Context30
Frontend Development20
मूल्य निर्धारण
इनपुट मूल्य$0.4 / 1M tokens
आउटपुट मूल्य$1.6 / 1M tokens
मिश्रित मूल्य (3:1)$0.7 / 1M tokens
गति
टोकन/सेकंड78.8 tokens/s
पहले टोकन में देरी0.52s
पहले उत्तर में देरी0.52s
उपलब्ध प्रदाता
(LS आंतरिक इकाइयाँ)| प्रदाता | इनपुट मूल्य | आउटपुट मूल्य |
|---|---|---|
| OpenAI | 400K | 1.6M |