मुख्य सामग्री पर जाएं

o3-mini

OpenAIOpenAI o-seriesProprietary

विवरण

A smaller variant of O3, expected to offer enhanced multimodal capabilities, improved reasoning, and more efficient resource utilization compared to previous models while maintaining strong performance on core tasks.

रिलीज़ तिथि
2025-01-31
पैरामीटर
संदर्भ लंबाई
200K
मोडैलिटीज़
file, text

क्षमता रडार

39
general
39
coding
83
reasoning
49
scienceअनुमानित
40
agents
85
multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन#रैंकस्कोरस्रोत
Code Ranking230
37.0
AA
General Ranking214
48.0
AA
Math Reasoning50
89.0
AA
Reasoning78
54.0
LS
Science146
54.0
AA

बेंचमार्क स्कोर (LLM Stats)

Biology

GPQA77.2%स्वयं

Code

Aider-Polyglot66.7%स्वयं
Aider-Polyglot Edit60.4%स्वयं
SWE-Bench Verified49.3%स्वयं
SWE-Lancer18.0%स्वयं
SWE-Lancer (IC-Diamond subset)7.4%स्वयं

Communication

Multi-IF79.5%स्वयं
TAU-bench Retail57.6%स्वयं
Multi-Challenge39.9%स्वयं
TAU-bench Airline32.4%स्वयं

Factuality

SimpleQA15.0%स्वयं

Finance

MMLU86.9%स्वयं

General

IFEval93.9%स्वयं
LiveBench84.6%स्वयं
Multilingual MMLU80.7%स्वयं
Internal API instruction following (hard)50.0%स्वयं

Language

COLLIE98.7%स्वयं

Long Context

OpenAI-MRCR: 2 needle 128k18.7%स्वयं
ComplexFuncBench17.6%स्वयं

Math

MATH97.9%स्वयं
MGSM92.0%स्वयं
AIME 202487.3%स्वयं
FrontierMath9.2%स्वयं

Reasoning

Graphwalks parents <128k58.3%स्वयं
Graphwalks BFS <128k51.0%स्वयं

AA मूल्यांकन सूचकांक

Intelligence Index
25.9
Coding Index
17.9
Math 500
1.0
Mmlu Pro
0.8
Aime
0.8
Gpqa
0.7
Livecodebench
0.7
Scicode
0.4
Tau2
0.3
Hle
0.1
Terminalbench Hard
0.1

LLM Stats श्रेणी स्कोर

Writing
100
Finance
90
Healthcare
90
Instruction Following
90
Language
90
Legal
90
Biology
80
Chemistry
80
Math
80
Physics
80
General
70
Structured Output
60
Reasoning
60
Spatial Reasoning
50
Communication
50
Frontend Development
50
Tool Calling
40
Code
40
Long Context
20
Factuality
10

मूल्य निर्धारण

इनपुट मूल्य$1.1 / 1M tokens
आउटपुट मूल्य$4.4 / 1M tokens
मिश्रित मूल्य (3:1)$1.925 / 1M tokens

गति

टोकन/सेकंड135.1 tokens/s
पहले टोकन में देरी10.07s
पहले उत्तर में देरी10.07s

उपलब्ध प्रदाता

(LS आंतरिक इकाइयाँ)

कोई प्रदाता डेटा उपलब्ध नहीं

बाहरी लिंक