メインコンテンツへスキップ

o3-mini (high)

OpenAIOpenAI o-series

説明

A smaller variant of O3, expected to offer enhanced multimodal capabilities, improved reasoning, and more efficient resource utilization compared to previous models while maintaining strong performance on core tasks.

リリース日
2025-01-31
パラメータ
コンテキスト長
200K
モダリティ
text

能力レーダー

36
general
53
coding
88
reasoning
51
science推定
40
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
コーディングランキング185
50.0
AA
総合ランキング184
52.0
AA
数学的推論20
95.0
AA
科学135
56.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA77.2%自己申告

Code

Aider-Polyglot66.7%自己申告
Aider-Polyglot Edit60.4%自己申告
SWE-Bench Verified49.3%自己申告
SWE-Lancer18.0%自己申告
SWE-Lancer (IC-Diamond subset)7.4%自己申告

Communication

Multi-IF79.5%自己申告
TAU-bench Retail57.6%自己申告
Multi-Challenge39.9%自己申告
TAU-bench Airline32.4%自己申告

Factuality

SimpleQA15.0%自己申告

Finance

MMLU86.9%自己申告

General

IFEval93.9%自己申告
LiveBench84.6%自己申告
Multilingual MMLU80.7%自己申告
Internal API instruction following (hard)50.0%自己申告

Language

COLLIE98.7%自己申告

Long Context

OpenAI-MRCR: 2 needle 128k18.7%自己申告
ComplexFuncBench17.6%自己申告

Math

MATH97.9%自己申告
MGSM92.0%自己申告
AIME 202487.3%自己申告
FrontierMath9.2%自己申告

Reasoning

Graphwalks parents <128k58.3%自己申告
Graphwalks BFS <128k51.0%自己申告

AA評価指数

Coding Index
42.1
Intelligence Index
18.4
Math 500
1.0
Aime
0.9
Mmlu Pro
0.8
Gpqa
0.8
Livecodebench
0.7
Ifbench
0.7
Scicode
0.4
Lcr
0.4
Tau2
0.3
Hle
0.1
Terminalbench Hard
0.1

LLM Statsカテゴリスコア

Writing
100
Instruction Following
90
Language
90
Legal
90
Finance
90
Healthcare
90
Math
80
Physics
80
Biology
80
Chemistry
80
General
70
Reasoning
60
Structured Output
60
Spatial Reasoning
50
Frontend Development
50
Communication
50
Code
40
Tool Calling
40
Long Context
20
Factuality
10

価格設定

入力価格$1.1 / 1Mトークン
出力価格$4.4 / 1Mトークン
混合価格(3:1)$1.925 / 1Mトークン
キャッシュ読み取り価格$0.55 / 1Mトークン

速度

トークン/秒235.1
初トークン遅延20.86s
初回答遅延20.86s

プロバイダー価格ランキング

プロバイダー価格ランキング

9 プロバイダー

最安: Poe最高: Merge Gateway
プロバイダー入力出力
1Poe最安
$0.99
$4
2OpenAIプライマリ
$1.1
$4.4
3NanoGPT
$1.1
$4.4
4OpenRouter
$1.1
$4.4
5Kilo Gateway
$1.1
$4.4
6Cloudflare AI Gateway
$1.1
$4.4
7Vercel AI Gateway
$1.1
$4.4
8NEAR AI Cloud
$1.1
$4.4
9Merge Gateway
$1.1
$4.4

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク