o3-mini

OpenAIOpenAI o-seriesProprietary

Description

A smaller variant of O3, expected to offer enhanced multimodal capabilities, improved reasoning, and more efficient resource utilization compared to previous models while maintaining strong performance on core tasks.

Date de sortie

2025-01-31

Paramètres

—

Longueur du contexte

200K

Modalités

text

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement codage	217	45.0	AA
Classement général	234	45.0	AA
Raisonnement mathématique	50	89.0	AA
Raisonnement	83	54.0	LS
Science	168	52.0	AA

Scores de benchmarks (LLM Stats)

Biology

GPQA

77.2%Aut.

Code

Aider-Polyglot

66.7%Aut.

Aider-Polyglot Edit

60.4%Aut.

SWE-Bench Verified

49.3%Aut.

SWE-Lancer

18.0%Aut.

SWE-Lancer (IC-Diamond subset)

7.4%Aut.

Communication

Multi-IF

79.5%Aut.

TAU-bench Retail

57.6%Aut.

Multi-Challenge

39.9%Aut.

TAU-bench Airline

32.4%Aut.

Factuality

SimpleQA

15.0%Aut.

Finance

MMLU

86.9%Aut.

General

IFEval

93.9%Aut.

LiveBench

84.6%Aut.

Multilingual MMLU

80.7%Aut.

Internal API instruction following (hard)

50.0%Aut.

Language

COLLIE

98.7%Aut.

Long Context

OpenAI-MRCR: 2 needle 128k

18.7%Aut.

ComplexFuncBench

17.6%Aut.

Math

MATH

97.9%Aut.

MGSM

92.0%Aut.

AIME 2024

87.3%Aut.

FrontierMath

9.2%Aut.

Reasoning

Graphwalks parents <128k

58.3%Aut.

Graphwalks BFS <128k

51.0%Aut.

Indices d'évaluation AA

Intelligence Index

19.0

Math 500

1.0

Mmlu Pro

0.8

Aime

0.8

Gpqa

0.7

Livecodebench

0.7

Scicode

0.4

Tau2

0.3

Hle

0.1

Terminalbench Hard

0.1

Scores par catégorie LLM Stats

Writing

100

Instruction Following

Language

Legal

Finance

Healthcare

Math

Physics

Biology

Chemistry

General

Reasoning

Structured Output

Spatial Reasoning

Frontend Development

Communication

Code

Tool Calling

Long Context

Factuality

Tarification

Prix d'entrée$1.1 / 1M tokens

Prix de sortie$4.4 / 1M tokens

Prix mixte (3:1)$1.925 / 1M tokens

Prix de lecture cache$0.55 / 1M tokens

Vitesse

Tokens/sec229.8

Délai du premier token5.43s

Temps de réponse5.43s

Classement des Prix par Fournisseur

9 fournisseurs

Moins cher: NanoGPTPlus cher: Azure

FournisseurEntréeSortie

1NanoGPTMoins cher

$1.088

$4.3996

2OpenAIPRINCIPAL

$1.1

$4.4

3Abacus

$1.1

$4.4

4Jiekou.AI

$1.1

$4.4

5Helicone

$1.1

$4.4

6Azure Cognitive Services

$1.1

$4.4

7DigitalOcean

$1.1

$4.4

8LLM Gateway

$1.1

$4.4

9Azure

$1.1

$4.4

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

LLM Stats Artificial Analysis