o3-mini

OpenAIOpenAI o-seriesProprietary

विवरण

A smaller variant of O3, expected to offer enhanced multimodal capabilities, improved reasoning, and more efficient resource utilization compared to previous models while maintaining strong performance on core tasks.

रिलीज़ तिथि

2025-01-31

पैरामीटर

—

संदर्भ लंबाई

200K

मोडैलिटीज़

text

क्षमता रडार

general

coding

reasoning

scienceअनुमानित

agents

multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन	#रैंक	स्कोर	स्रोत
कोडिंग रैंकिंग	217	45.0	AA
सामान्य रैंकिंग	234	45.0	AA
गणितीय तर्क	50	89.0	AA
तर्क	83	54.0	LS
विज्ञान	168	52.0	AA

बेंचमार्क स्कोर (LLM Stats)

Biology

GPQA

77.2%स्वयं

Code

Aider-Polyglot

66.7%स्वयं

Aider-Polyglot Edit

60.4%स्वयं

SWE-Bench Verified

49.3%स्वयं

SWE-Lancer

18.0%स्वयं

SWE-Lancer (IC-Diamond subset)

7.4%स्वयं

Communication

Multi-IF

79.5%स्वयं

TAU-bench Retail

57.6%स्वयं

Multi-Challenge

39.9%स्वयं

TAU-bench Airline

32.4%स्वयं

Factuality

SimpleQA

15.0%स्वयं

Finance

MMLU

86.9%स्वयं

General

IFEval

93.9%स्वयं

LiveBench

84.6%स्वयं

Multilingual MMLU

80.7%स्वयं

Internal API instruction following (hard)

50.0%स्वयं

Language

COLLIE

98.7%स्वयं

Long Context

OpenAI-MRCR: 2 needle 128k

18.7%स्वयं

ComplexFuncBench

17.6%स्वयं

Math

MATH

97.9%स्वयं

MGSM

92.0%स्वयं

AIME 2024

87.3%स्वयं

FrontierMath

9.2%स्वयं

Reasoning

Graphwalks parents <128k

58.3%स्वयं

Graphwalks BFS <128k

51.0%स्वयं

AA मूल्यांकन सूचकांक

Intelligence Index

19.0

Math 500

1.0

Mmlu Pro

0.8

Aime

0.8

Gpqa

0.7

Livecodebench

0.7

Scicode

0.4

Tau2

0.3

Hle

0.1

Terminalbench Hard

0.1

LLM Stats श्रेणी स्कोर

Writing

100

Instruction Following

Language

Legal

Finance

Healthcare

Math

Physics

Biology

Chemistry

General

Reasoning

Structured Output

Spatial Reasoning

Frontend Development

Communication

Code

Tool Calling

Long Context

Factuality

मूल्य निर्धारण

इनपुट मूल्य$1.1 / 1M टोकन

आउटपुट मूल्य$4.4 / 1M टोकन

मिश्रित मूल्य (3:1)$1.925 / 1M टोकन

कैश पठन मूल्य$0.55 / 1M टोकन

गति

टोकन/सेकंड229.8

पहले टोकन में देरी5.43s

पहले उत्तर में देरी5.43s

प्रदाता मूल्य रैंकिंग

9 प्रदाता

सबसे सस्ता: NanoGPTसबसे महंगा: Azure

प्रदाताइनपुटआउटपुट

1NanoGPTसबसे सस्ता

$1.088

$4.3996

2OpenAIप्राथमिक

$1.1

$4.4

3Abacus

$1.1

$4.4

4Jiekou.AI

$1.1

$4.4

5Helicone

$1.1

$4.4

6Azure Cognitive Services

$1.1

$4.4

7DigitalOcean

$1.1

$4.4

8LLM Gateway

$1.1

$4.4

9Azure

$1.1

$4.4

इस मॉडल के लिए विभिन्न API प्रदाताओं के मूल्य निर्धारण की तुलना करें।

बाहरी लिंक

LLM Stats Artificial Analysis