मुख्य सामग्री पर जाएं

o1

OpenAIOpenAI o-seriesProprietary

विवरण

A research preview model focused on mathematical and logical reasoning capabilities, demonstrating improved performance on tasks requiring step-by-step reasoning, mathematical problem-solving, and code generation. The model shows enhanced capabilities in formal reasoning while maintaining strong general capabilities.

रिलीज़ तिथि
2024-12-05
पैरामीटर
संदर्भ लंबाई
200K
मोडैलिटीज़
file, image, text

क्षमता रडार

43
general
39
coding
80
reasoning
48
scienceअनुमानित
60
agents
70
multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन#रैंकस्कोरस्रोत
Code Ranking157
49.0
AA
General Ranking104
66.0
AA
Math Reasoning55
87.0
AA
Science169
51.0
AA

बेंचमार्क स्कोर (LLM Stats)

Biology

GPQA78.0%स्वयं
GPQA Biology69.2%स्वयं

Chemistry

GPQA Chemistry64.7%स्वयं

Code

HumanEval88.1%स्वयं
SWE-Bench Verified41.0%स्वयं

Communication

TAU-bench Retail70.8%स्वयं
TAU-bench Airline50.0%स्वयं

Factuality

SimpleQA47.0%स्वयं

Finance

MMLU91.8%स्वयं

General

MMMLU87.7%स्वयं
MMMU77.6%स्वयं
LiveBench67.0%स्वयं

Math

GSM8k97.1%स्वयं
MATH96.4%स्वयं
MGSM89.3%स्वयं
AIME 202474.3%स्वयं
MathVista71.8%स्वयं
FrontierMath5.5%स्वयं

Physics

GPQA Physics92.8%स्वयं

AA मूल्यांकन सूचकांक

Intelligence Index
30.8
Coding Index
20.5
Math 500
1.0
Mmlu Pro
0.8
Gpqa
0.7
Aime
0.7
Ifbench
0.7
Livecodebench
0.7
Tau2
0.6
Lcr
0.6
Scicode
0.4
Terminalbench Hard
0.1
Hle
0.1

LLM Stats श्रेणी स्कोर

Finance
90
Language
90
Legal
90
Biology
80
Chemistry
80
Healthcare
80
Math
80
Physics
80
Vision
70
General
70
Multimodal
70
Reasoning
70
Tool Calling
60
Code
60
Communication
60
Factuality
50
Frontend Development
40

मूल्य निर्धारण

इनपुट मूल्य$15 / 1M tokens
आउटपुट मूल्य$60 / 1M tokens
मिश्रित मूल्य (3:1)$26.25 / 1M tokens

गति

टोकन/सेकंड111.0 tokens/s
पहले टोकन में देरी22.15s
पहले उत्तर में देरी22.15s

उपलब्ध प्रदाता

(LS आंतरिक इकाइयाँ)

कोई प्रदाता डेटा उपलब्ध नहीं

बाहरी लिंक