o4-mini (high)
OpenAIOpenAI o-seriesProprietary
説明
o4-mini is OpenAI's latest small o-series model, optimized for fast, effective reasoning with exceptionally efficient performance in coding and visual tasks. It is faster and more affordable than o3.
リリース日
2025-04-16
パラメータ
—
コンテキスト長
200K
モダリティ
file, image, text
能力レーダー
46
general
49
coding
92
reasoning
55
science推定
60
agents
85
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 70 | 52.0 | LS |
| Code Ranking | 118 | 56.0 | AA |
| General Ranking | 105 | 66.0 | AA |
| Math Reasoning | 18 | 95.0 | AA |
| Multimodal Ranking | 57 | 72.0 | LS |
| Science | 76 | 66.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
BrowseComp
51.5%自己申告
Biology
GPQA
81.4%自己申告
Code
Aider-Polyglot
68.9%自己申告
SWE-Bench Verified
68.1%自己申告
Aider-Polyglot Edit
58.2%自己申告
Communication
TAU-bench Retail
71.8%自己申告
TAU-bench Airline
49.2%自己申告
Multi-Challenge
43.0%自己申告
General
MMMU
81.6%自己申告
Math
AIME 2024
93.4%自己申告
AIME 2025
92.7%自己申告
MathVista
84.3%自己申告
Humanity's Last Exam
14.7%自己申告
Multimodal
CharXiv-R
72.0%自己申告
AA評価指数
Math Index90.7
Intelligence Index33.1
Coding Index25.6
Math 5001.0
Aime0.9
Aime 250.9
Livecodebench0.9
Mmlu Pro0.8
Gpqa0.8
Ifbench0.7
Tau20.6
Lcr0.6
Scicode0.5
Hle0.2
Terminalbench Hard0.2
LLM Statsカテゴリスコア
Biology80
Chemistry80
Healthcare80
Multimodal80
Physics80
Code70
Frontend Development70
General70
Math70
Reasoning70
Tool Calling60
Vision60
Agents50
Communication50
Search50
価格設定
入力価格$1.1 / 1M tokens
出力価格$4.4 / 1M tokens
混合価格(3:1)$1.925 / 1M tokens
速度
トークン/秒129.4 tokens/s
初トークン遅延29.37s
初回答遅延29.37s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません