o3-mini

OpenAIOpenAI o-seriesProprietary

설명

A smaller variant of O3, expected to offer enhanced multimodal capabilities, improved reasoning, and more efficient resource utilization compared to previous models while maintaining strong performance on core tasks.

출시일

2025-01-31

파라미터

—

컨텍스트 길이

200K

모달리티

text

능력 레이더

general

coding

reasoning

science추정

agents

multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인	#순위	점수	소스
코딩 랭킹	217	45.0	AA
종합 랭킹	234	45.0	AA
수학 추론	50	89.0	AA
추론	83	54.0	LS
과학	168	52.0	AA

벤치마크 점수 (LLM Stats)

Biology

GPQA

77.2%자체 보고

Code

Aider-Polyglot

66.7%자체 보고

Aider-Polyglot Edit

60.4%자체 보고

SWE-Bench Verified

49.3%자체 보고

SWE-Lancer

18.0%자체 보고

SWE-Lancer (IC-Diamond subset)

7.4%자체 보고

Communication

Multi-IF

79.5%자체 보고

TAU-bench Retail

57.6%자체 보고

Multi-Challenge

39.9%자체 보고

TAU-bench Airline

32.4%자체 보고

Factuality

SimpleQA

15.0%자체 보고

Finance

MMLU

86.9%자체 보고

General

IFEval

93.9%자체 보고

LiveBench

84.6%자체 보고

Multilingual MMLU

80.7%자체 보고

Internal API instruction following (hard)

50.0%자체 보고

Language

COLLIE

98.7%자체 보고

Long Context

OpenAI-MRCR: 2 needle 128k

18.7%자체 보고

ComplexFuncBench

17.6%자체 보고

Math

MATH

97.9%자체 보고

MGSM

92.0%자체 보고

AIME 2024

87.3%자체 보고

FrontierMath

9.2%자체 보고

Reasoning

Graphwalks parents <128k

58.3%자체 보고

Graphwalks BFS <128k

51.0%자체 보고

AA 평가 지수

Intelligence Index

19.0

Math 500

1.0

Mmlu Pro

0.8

Aime

0.8

Gpqa

0.7

Livecodebench

0.7

Scicode

0.4

Tau2

0.3

Hle

0.1

Terminalbench Hard

0.1

LLM Stats 카테고리 점수

Writing

100

Instruction Following

Language

Legal

Finance

Healthcare

Math

Physics

Biology

Chemistry

General

Reasoning

Structured Output

Spatial Reasoning

Frontend Development

Communication

Code

Tool Calling

Long Context

Factuality

가격

입력 가격$1.1 / 1M 토큰

출력 가격$4.4 / 1M 토큰

혼합 가격 (3:1)$1.925 / 1M 토큰

캐시 읽기 가격$0.55 / 1M 토큰

속도

토큰/초229.9

첫 토큰 지연5.91s

첫 응답 지연5.91s

공급자 가격 순위

9개 공급자

최저가: NanoGPT최고가: Azure

공급자입력출력

1NanoGPT최저가

$1.088

$4.3996

2OpenAI주요

$1.1

$4.4

3Abacus

$1.1

$4.4

4Jiekou.AI

$1.1

$4.4

5Helicone

$1.1

$4.4

6Azure Cognitive Services

$1.1

$4.4

7DigitalOcean

$1.1

$4.4

8LLM Gateway

$1.1

$4.4

9Azure

$1.1

$4.4

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크

LLM Stats Artificial Analysis