o3-mini (high)
OpenAIOpenAI o-series
説明
A smaller variant of O3, expected to offer enhanced multimodal capabilities, improved reasoning, and more efficient resource utilization compared to previous models while maintaining strong performance on core tasks.
リリース日
2025-01-31
パラメータ
—
コンテキスト長
200K
モダリティ
text
能力レーダー
36
general
53
coding
88
reasoning
51
science推定
40
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 185 | 50.0 | AA |
| 総合ランキング | 184 | 52.0 | AA |
| 数学的推論 | 20 | 95.0 | AA |
| 科学 | 135 | 56.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
77.2%自己申告
Code
Aider-Polyglot
66.7%自己申告
Aider-Polyglot Edit
60.4%自己申告
SWE-Bench Verified
49.3%自己申告
SWE-Lancer
18.0%自己申告
SWE-Lancer (IC-Diamond subset)
7.4%自己申告
Communication
Multi-IF
79.5%自己申告
TAU-bench Retail
57.6%自己申告
Multi-Challenge
39.9%自己申告
TAU-bench Airline
32.4%自己申告
Factuality
SimpleQA
15.0%自己申告
Finance
MMLU
86.9%自己申告
General
IFEval
93.9%自己申告
LiveBench
84.6%自己申告
Multilingual MMLU
80.7%自己申告
Internal API instruction following (hard)
50.0%自己申告
Language
COLLIE
98.7%自己申告
Long Context
OpenAI-MRCR: 2 needle 128k
18.7%自己申告
ComplexFuncBench
17.6%自己申告
Math
MATH
97.9%自己申告
MGSM
92.0%自己申告
AIME 2024
87.3%自己申告
FrontierMath
9.2%自己申告
Reasoning
Graphwalks parents <128k
58.3%自己申告
Graphwalks BFS <128k
51.0%自己申告
AA評価指数
Coding Index42.1
Intelligence Index18.4
Math 5001.0
Aime0.9
Mmlu Pro0.8
Gpqa0.8
Livecodebench0.7
Ifbench0.7
Scicode0.4
Lcr0.4
Tau20.3
Hle0.1
Terminalbench Hard0.1
LLM Statsカテゴリスコア
Writing100
Instruction Following90
Language90
Legal90
Finance90
Healthcare90
Math80
Physics80
Biology80
Chemistry80
General70
Reasoning60
Structured Output60
Spatial Reasoning50
Frontend Development50
Communication50
Code40
Tool Calling40
Long Context20
Factuality10
価格設定
入力価格$1.1 / 1Mトークン
出力価格$4.4 / 1Mトークン
混合価格(3:1)$1.925 / 1Mトークン
キャッシュ読み取り価格$0.55 / 1Mトークン
速度
トークン/秒235.1
初トークン遅延20.86s
初回答遅延20.86s
プロバイダー価格ランキング
プロバイダー価格ランキング
9 プロバイダー
最安: Poe最高: Merge Gateway
プロバイダー入力出力
1Poe最安
$0.99
$4
2OpenAIプライマリ
$1.1
$4.4
3NanoGPT
$1.1
$4.4
4OpenRouter
$1.1
$4.4
5Kilo Gateway
$1.1
$4.4
6Cloudflare AI Gateway
$1.1
$4.4
7Vercel AI Gateway
$1.1
$4.4
8NEAR AI Cloud
$1.1
$4.4
9Merge Gateway
$1.1
$4.4
このモデルの異なるAPIプロバイダー間の価格を比較。