メインコンテンツへスキップ

o1-preview

OpenAIOpenAI o-seriesProprietary

説明

A research preview model focused on mathematical and logical reasoning capabilities, demonstrating improved performance on tasks requiring step-by-step reasoning, mathematical problem-solving, and code generation. The model shows enhanced capabilities in formal reasoning while maintaining strong general capabilities.

リリース日
2024-09-12
パラメータ
コンテキスト長
200K
モダリティ
file, image, text

能力レーダー

24
general
34
coding
92
reasoning
60
science推定
0
agents
80
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking109
58.0
AA
General Ranking325
34.0
AA
Math Reasoning27
93.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA73.3%自己申告

Code

SWE-Bench Verified41.3%自己申告

Factuality

SimpleQA42.4%自己申告

Finance

MMLU90.8%自己申告

General

LiveBench52.3%自己申告

Math

MGSM90.8%自己申告
MATH85.5%自己申告
AIME 202442.0%自己申告

AA評価指数

Coding Index
34.0
Intelligence Index
23.7
Math 500
0.9

LLM Statsカテゴリスコア

Finance
90
Healthcare
90
Language
90
Legal
90
Biology
70
Chemistry
70
Math
70
Physics
70
General
60
Reasoning
60
Code
40
Factuality
40
Frontend Development
40

価格設定

入力価格$16.5 / 1M tokens
出力価格$66 / 1M tokens
混合価格(3:1)$28.875 / 1M tokens

速度

トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク