메인 콘텐츠로 건너뛰기

o3-mini (high)

OpenAIOpenAI o-series

설명

A smaller variant of O3, expected to offer enhanced multimodal capabilities, improved reasoning, and more efficient resource utilization compared to previous models while maintaining strong performance on core tasks.

출시일
2025-01-31
파라미터
컨텍스트 길이
200K
모달리티
text

능력 레이더

36
general
53
coding
88
reasoning
51
science추정
40
agents
0
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
코딩 랭킹185
50.0
AA
종합 랭킹184
52.0
AA
수학 추론20
95.0
AA
과학135
56.0
AA

벤치마크 점수 (LLM Stats)

Biology

GPQA77.2%자체 보고

Code

Aider-Polyglot66.7%자체 보고
Aider-Polyglot Edit60.4%자체 보고
SWE-Bench Verified49.3%자체 보고
SWE-Lancer18.0%자체 보고
SWE-Lancer (IC-Diamond subset)7.4%자체 보고

Communication

Multi-IF79.5%자체 보고
TAU-bench Retail57.6%자체 보고
Multi-Challenge39.9%자체 보고
TAU-bench Airline32.4%자체 보고

Factuality

SimpleQA15.0%자체 보고

Finance

MMLU86.9%자체 보고

General

IFEval93.9%자체 보고
LiveBench84.6%자체 보고
Multilingual MMLU80.7%자체 보고
Internal API instruction following (hard)50.0%자체 보고

Language

COLLIE98.7%자체 보고

Long Context

OpenAI-MRCR: 2 needle 128k18.7%자체 보고
ComplexFuncBench17.6%자체 보고

Math

MATH97.9%자체 보고
MGSM92.0%자체 보고
AIME 202487.3%자체 보고
FrontierMath9.2%자체 보고

Reasoning

Graphwalks parents <128k58.3%자체 보고
Graphwalks BFS <128k51.0%자체 보고

AA 평가 지수

Coding Index
42.1
Intelligence Index
18.4
Math 500
1.0
Aime
0.9
Mmlu Pro
0.8
Gpqa
0.8
Livecodebench
0.7
Ifbench
0.7
Scicode
0.4
Lcr
0.4
Tau2
0.3
Hle
0.1
Terminalbench Hard
0.1

LLM Stats 카테고리 점수

Writing
100
Instruction Following
90
Language
90
Legal
90
Finance
90
Healthcare
90
Math
80
Physics
80
Biology
80
Chemistry
80
General
70
Reasoning
60
Structured Output
60
Spatial Reasoning
50
Frontend Development
50
Communication
50
Code
40
Tool Calling
40
Long Context
20
Factuality
10

가격

입력 가격$1.1 / 1M 토큰
출력 가격$4.4 / 1M 토큰
혼합 가격 (3:1)$1.925 / 1M 토큰
캐시 읽기 가격$0.55 / 1M 토큰

속도

토큰/초235.1
첫 토큰 지연20.86s
첫 응답 지연20.86s

공급자 가격 순위

공급자 가격 순위

9개 공급자

최저가: Poe최고가: Merge Gateway
공급자입력출력
1Poe최저가
$0.99
$4
2OpenAI주요
$1.1
$4.4
3NanoGPT
$1.1
$4.4
4OpenRouter
$1.1
$4.4
5Kilo Gateway
$1.1
$4.4
6Cloudflare AI Gateway
$1.1
$4.4
7Vercel AI Gateway
$1.1
$4.4
8NEAR AI Cloud
$1.1
$4.4
9Merge Gateway
$1.1
$4.4

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크