o3
OpenAIOpenAI o-seriesProprietary
विवरण
OpenAI's most powerful reasoning model. o3 is a well-rounded and powerful model across domains. It sets a new standard for math, science, coding, and visual reasoning tasks. It also excels at technical writing and instruction-following. Use it to think through multi-step problems that involve analysis across text, code, and images.
रिलीज़ तिथि
2025-04-16
पैरामीटर
—
संदर्भ लंबाई
200K
मोडैलिटीज़
file, image, text
क्षमता रडार
50
general
54
coding
90
reasoning
56
scienceअनुमानित
70
agents
85
multimodal
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| Agents & Tools | 50 | 57.0 | LS |
| Code Ranking | 41 | 74.0 | AA |
| General Ranking | 55 | 77.0 | AA |
| Math Reasoning | 28 | 92.0 | AA |
| Multimodal Ranking | 33 | 79.0 | LS |
| Reasoning | 81 | 53.0 | LS |
| Science | 73 | 66.0 | AA |
बेंचमार्क स्कोर (LLM Stats)
Agents
Tau-bench
63.0%स्वयं
BrowseComp
49.7%स्वयं
Biology
GPQA
83.3%स्वयं
Code
Aider-Polyglot
81.3%स्वयं
SWE-Bench Verified
69.1%स्वयं
Communication
Tau2 Retail
80.2%स्वयं
Tau2 Airline
64.8%स्वयं
Multi-Challenge
60.4%स्वयं
Tau2 Telecom
58.2%स्वयं
General
MMMU
82.9%स्वयं
MMMU-Pro
76.4%स्वयं
Healthcare
VideoMMMU
83.3%स्वयं
Language
COLLIE
98.4%स्वयं
Math
AIME 2024
91.6%स्वयं
MathVista
86.8%स्वयं
AIME 2025
86.4%स्वयं
FrontierMath
15.8%स्वयं
Humanity's Last Exam
14.7%स्वयं
Multimodal
CharXiv-R
78.6%स्वयं
Reasoning
ARC-AGI
88.0%स्वयं
ERQA
64.0%स्वयं
ARC-AGI v2
6.5%स्वयं
AA मूल्यांकन सूचकांक
Math Index88.3
Intelligence Index38.4
Coding Index38.4
Math 5001.0
Aime0.9
Aime 250.9
Mmlu Pro0.9
Gpqa0.8
Livecodebench0.8
Tau20.8
Ifbench0.7
Lcr0.7
Scicode0.4
Terminalbench Hard0.4
Hle0.2
LLM Stats श्रेणी स्कोर
Writing100
Language100
Biology80
Chemistry80
Code80
General80
Healthcare80
Multimodal80
Physics80
Tool Calling70
Communication70
Frontend Development70
Reasoning70
Vision60
Agents60
Math60
Spatial Reasoning50
Search50
मूल्य निर्धारण
इनपुट मूल्य$2 / 1M tokens
आउटपुट मूल्य$8 / 1M tokens
मिश्रित मूल्य (3:1)$3.5 / 1M tokens
गति
टोकन/सेकंड92.1 tokens/s
पहले टोकन में देरी9.54s
पहले उत्तर में देरी9.54s
उपलब्ध प्रदाता
(LS आंतरिक इकाइयाँ)कोई प्रदाता डेटा उपलब्ध नहीं