o4-mini (high)
OpenAIOpenAI o-seriesProprietary
説明
o4-mini is OpenAI's latest small o-series model, optimized for fast, effective reasoning with exceptionally efficient performance in coding and visual tasks. It is faster and more affordable than o3.
リリース日
2025-04-16
パラメータ
—
コンテキスト長
200K
モダリティ
image, text
能力レーダー
42
general
77
coding
92
reasoning
55
science推定
60
agents
85
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| エージェント能力 | 81 | 52.0 | LS |
| コーディングランキング | 109 | 64.0 | AA |
| 総合ランキング | 112 | 62.0 | AA |
| 数学的推論 | 16 | 95.0 | AA |
| マルチモーダルランキング | 64 | 72.0 | LS |
| 科学 | 90 | 63.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
BrowseComp
51.5%自己申告
Biology
GPQA
81.4%自己申告
Code
Aider-Polyglot
68.9%自己申告
SWE-Bench Verified
68.1%自己申告
Aider-Polyglot Edit
58.2%自己申告
Communication
TAU-bench Retail
71.8%自己申告
TAU-bench Airline
49.2%自己申告
Multi-Challenge
43.0%自己申告
General
MMMU
81.6%自己申告
Math
AIME 2024
93.4%自己申告
AIME 2025
92.7%自己申告
MathVista
84.3%自己申告
Humanity's Last Exam
14.7%自己申告
Multimodal
CharXiv-R
72.0%自己申告
AA評価指数
Math Index90.7
Intelligence Index25.6
Math 5001.0
Aime0.9
Aime 250.9
Livecodebench0.9
Mmlu Pro0.8
Gpqa0.8
Ifbench0.7
Tau20.6
Lcr0.6
Scicode0.5
Hle0.2
Terminalbench Hard0.2
LLM Statsカテゴリスコア
Multimodal80
Physics80
Healthcare80
Biology80
Chemistry80
Math70
Reasoning70
Frontend Development70
General70
Code70
Tool Calling60
Vision60
Search50
Agents50
Communication50
価格設定
入力価格$1.1 / 1Mトークン
出力価格$4.4 / 1Mトークン
混合価格(3:1)$1.925 / 1Mトークン
キャッシュ読み取り価格$0.275 / 1Mトークン
速度
トークン/秒190.8
初トークン遅延22.02s
初回答遅延22.02s
プロバイダー価格ランキング
プロバイダー価格ランキング
16 プロバイダー
最安: Poe最高: Merge Gateway
プロバイダー入力出力
1Poe最安
$0.99
$4
2OpenAIプライマリ
$1.1
$4.4
3NanoGPT
$1.1
$4.4
4Abacus
$1.1
$4.4
5OpenRouter
$1.1
$4.4
6Jiekou.AI
$1.1
$4.4
7Kilo Gateway
$1.1
$4.4
8Cloudflare AI Gateway
$1.1
$4.4
9Helicone
$1.1
$4.4
10Azure Cognitive Services
$1.1
$4.4
11Requesty
$1.1
$4.4
12Vercel AI Gateway
$1.1
$4.4
13LLM Gateway
$1.1
$4.4
14Azure
$1.1
$4.4
15NEAR AI Cloud
$1.1
$4.4
16Merge Gateway
$1.1
$4.4
このモデルの異なるAPIプロバイダー間の価格を比較。