o1-preview
OpenAIOpenAI o-seriesProprietary
説明
A research preview model focused on mathematical and logical reasoning capabilities, demonstrating improved performance on tasks requiring step-by-step reasoning, mathematical problem-solving, and code generation. The model shows enhanced capabilities in formal reasoning while maintaining strong general capabilities.
リリース日
2024-09-12
パラメータ
—
コンテキスト長
200K
モダリティ
file, image, text
能力レーダー
24
general
34
coding
92
reasoning
60
science推定
0
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 109 | 58.0 | AA |
| General Ranking | 325 | 34.0 | AA |
| Math Reasoning | 27 | 93.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
73.3%自己申告
Code
SWE-Bench Verified
41.3%自己申告
Factuality
SimpleQA
42.4%自己申告
Finance
MMLU
90.8%自己申告
General
LiveBench
52.3%自己申告
Math
MGSM
90.8%自己申告
MATH
85.5%自己申告
AIME 2024
42.0%自己申告
AA評価指数
Coding Index34.0
Intelligence Index23.7
Math 5000.9
LLM Statsカテゴリスコア
Finance90
Healthcare90
Language90
Legal90
Biology70
Chemistry70
Math70
Physics70
General60
Reasoning60
Code40
Factuality40
Frontend Development40
価格設定
入力価格$16.5 / 1M tokens
出力価格$66 / 1M tokens
混合価格(3:1)$28.875 / 1M tokens
速度
トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません