o1

OpenAIOpenAI o-seriesProprietary

विवरण

A research preview model focused on mathematical and logical reasoning capabilities, demonstrating improved performance on tasks requiring step-by-step reasoning, mathematical problem-solving, and code generation. The model shows enhanced capabilities in formal reasoning while maintaining strong general capabilities.

रिलीज़ तिथि

2024-12-05

पैरामीटर

—

संदर्भ लंबाई

200K

मोडैलिटीज़

image, pdf, text

क्षमता रडार

general

coding

reasoning

scienceअनुमानित

agents

multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन	#रैंक	स्कोर	स्रोत
कोडिंग रैंकिंग	151	55.0	AA
सामान्य रैंकिंग	105	63.0	AA
गणितीय तर्क	55	87.0	AA
विज्ञान	195	49.0	AA

बेंचमार्क स्कोर (LLM Stats)

Biology

GPQA

78.0%स्वयं

GPQA Biology

69.2%स्वयं

Chemistry

GPQA Chemistry

64.7%स्वयं

Code

HumanEval

88.1%स्वयं

SWE-Bench Verified

41.0%स्वयं

Communication

TAU-bench Retail

70.8%स्वयं

TAU-bench Airline

50.0%स्वयं

Factuality

SimpleQA

47.0%स्वयं

Finance

MMLU

91.8%स्वयं

General

MMMLU

87.7%स्वयं

MMMU

77.6%स्वयं

LiveBench

67.0%स्वयं

Math

GSM8k

97.1%स्वयं

MATH

96.4%स्वयं

MGSM

89.3%स्वयं

AIME 2024

74.3%स्वयं

MathVista

71.8%स्वयं

FrontierMath

5.5%स्वयं

Physics

GPQA Physics

92.8%स्वयं

AA मूल्यांकन सूचकांक

Coding Index

39.7

Intelligence Index

23.4

Math 500

1.0

Mmlu Pro

0.8

Gpqa

0.7

Aime

0.7

Ifbench

0.7

Livecodebench

0.7

Tau2

0.6

Lcr

0.6

Scicode

0.4

Terminalbench Hard

0.1

Hle

0.1

LLM Stats श्रेणी स्कोर

Language

Legal

Finance

Math

Physics

Healthcare

Biology

Chemistry

Multimodal

Reasoning

General

Vision

Code

Communication

Tool Calling

Factuality

Frontend Development

मूल्य निर्धारण

इनपुट मूल्य$15 / 1M टोकन

आउटपुट मूल्य$60 / 1M टोकन

मिश्रित मूल्य (3:1)$26.25 / 1M टोकन

कैश पठन मूल्य$7.5 / 1M टोकन

गति

टोकन/सेकंड147.9

पहले टोकन में देरी13.04s

पहले उत्तर में देरी13.04s

प्रदाता मूल्य रैंकिंग

13 प्रदाता

सबसे सस्ता: Poeसबसे महंगा: Merge Gateway

प्रदाताइनपुटआउटपुट

1Poeसबसे सस्ता

$14

$54

2NanoGPT

$14.994

$59.993

3OpenAIप्राथमिक

$15

$60

4OpenRouter

$15

$60

5Kilo Gateway

$15

$60

6Cloudflare AI Gateway

$15

$60

7Helicone

$15

$60

8Azure Cognitive Services

$15

$60

9DigitalOcean

$15

$60

10Vercel AI Gateway

$15

$60

11LLM Gateway

$15

$60

12Azure

$15

$60

13Merge Gateway

$15

$60

इस मॉडल के लिए विभिन्न API प्रदाताओं के मूल्य निर्धारण की तुलना करें।

बाहरी लिंक

LLM Stats Artificial Analysis