o4-mini (high)
OpenAIOpenAI o-seriesProprietary
설명
o4-mini is OpenAI's latest small o-series model, optimized for fast, effective reasoning with exceptionally efficient performance in coding and visual tasks. It is faster and more affordable than o3.
출시일
2025-04-16
파라미터
—
컨텍스트 길이
200K
모달리티
file, image, text
능력 레이더
46
general
49
coding
92
reasoning
55
science추정
60
agents
85
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Agents & Tools | 70 | 52.0 | LS |
| Code Ranking | 118 | 56.0 | AA |
| General Ranking | 105 | 66.0 | AA |
| Math Reasoning | 18 | 95.0 | AA |
| Multimodal Ranking | 57 | 72.0 | LS |
| Science | 76 | 66.0 | AA |
벤치마크 점수 (LLM Stats)
Agents
BrowseComp
51.5%자체 보고
Biology
GPQA
81.4%자체 보고
Code
Aider-Polyglot
68.9%자체 보고
SWE-Bench Verified
68.1%자체 보고
Aider-Polyglot Edit
58.2%자체 보고
Communication
TAU-bench Retail
71.8%자체 보고
TAU-bench Airline
49.2%자체 보고
Multi-Challenge
43.0%자체 보고
General
MMMU
81.6%자체 보고
Math
AIME 2024
93.4%자체 보고
AIME 2025
92.7%자체 보고
MathVista
84.3%자체 보고
Humanity's Last Exam
14.7%자체 보고
Multimodal
CharXiv-R
72.0%자체 보고
AA 평가 지수
Math Index90.7
Intelligence Index33.1
Coding Index25.6
Math 5001.0
Aime0.9
Aime 250.9
Livecodebench0.9
Mmlu Pro0.8
Gpqa0.8
Ifbench0.7
Tau20.6
Lcr0.6
Scicode0.5
Hle0.2
Terminalbench Hard0.2
LLM Stats 카테고리 점수
Biology80
Chemistry80
Healthcare80
Multimodal80
Physics80
Code70
Frontend Development70
General70
Math70
Reasoning70
Tool Calling60
Vision60
Agents50
Communication50
Search50
가격
입력 가격$1.1 / 1M tokens
출력 가격$4.4 / 1M tokens
혼합 가격 (3:1)$1.925 / 1M tokens
속도
토큰/초129.4 tokens/s
첫 토큰 지연29.37s
첫 응답 지연29.37s
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다