跳转到主要内容

o4-mini (high)

OpenAIOpenAI o-seriesProprietary

描述

o4-mini is OpenAI's latest small o-series model, optimized for fast, effective reasoning with exceptionally efficient performance in coding and visual tasks. It is faster and more affordable than o3.

发布日期
2025-04-16
参数规模
上下文长度
200K
支持模态
file, image, text

能力雷达图

46
general
49
coding
92
reasoning
55
science估算
60
agents
85
multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域#排名分数来源
智能体与工具70
52.0
LS
代码能力榜118
56.0
AA
通用能力榜105
66.0
AA
数学推理18
95.0
AA
多模态榜57
72.0
LS
科学能力76
66.0
AA

基准测试分数 (LLM Stats)

Agents

BrowseComp51.5%自报

Biology

GPQA81.4%自报

Code

Aider-Polyglot68.9%自报
SWE-Bench Verified68.1%自报
Aider-Polyglot Edit58.2%自报

Communication

TAU-bench Retail71.8%自报
TAU-bench Airline49.2%自报
Multi-Challenge43.0%自报

General

MMMU81.6%自报

Math

AIME 202493.4%自报
AIME 202592.7%自报
MathVista84.3%自报
Humanity's Last Exam14.7%自报

Multimodal

CharXiv-R72.0%自报

AA 评测指数

Math Index
90.7
Intelligence Index
33.1
Coding Index
25.6
Math 500
1.0
Aime
0.9
Aime 25
0.9
Livecodebench
0.9
Mmlu Pro
0.8
Gpqa
0.8
Ifbench
0.7
Tau2
0.6
Lcr
0.6
Scicode
0.5
Hle
0.2
Terminalbench Hard
0.2

LLM Stats 分类评分

Biology
80
Chemistry
80
Healthcare
80
Multimodal
80
Physics
80
Code
70
Frontend Development
70
General
70
Math
70
Reasoning
70
Tool Calling
60
Vision
60
Agents
50
Communication
50
Search
50

定价

输入价格$1.1 / 1M tokens
输出价格$4.4 / 1M tokens
混合价格(3:1)$1.925 / 1M tokens

速度

Tokens/秒129.4 tokens/s
首Token延迟29.37s
首回答延迟29.37s

可用提供商

(LS 内部计价单位)

暂无提供商数据

外部链接