o3-mini (high)

OpenAIOpenAI o-series

Description

A smaller variant of O3, expected to offer enhanced multimodal capabilities, improved reasoning, and more efficient resource utilization compared to previous models while maintaining strong performance on core tasks.

Date de sortie

2025-01-31

Paramètres

—

Longueur du contexte

200K

Modalités

text

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement codage	185	50.0	AA
Classement général	184	52.0	AA
Raisonnement mathématique	20	95.0	AA
Science	135	56.0	AA

Scores de benchmarks (LLM Stats)

Biology

GPQA

77.2%Aut.

Code

Aider-Polyglot

66.7%Aut.

Aider-Polyglot Edit

60.4%Aut.

SWE-Bench Verified

49.3%Aut.

SWE-Lancer

18.0%Aut.

SWE-Lancer (IC-Diamond subset)

7.4%Aut.

Communication

Multi-IF

79.5%Aut.

TAU-bench Retail

57.6%Aut.

Multi-Challenge

39.9%Aut.

TAU-bench Airline

32.4%Aut.

Factuality

SimpleQA

15.0%Aut.

Finance

MMLU

86.9%Aut.

General

IFEval

93.9%Aut.

LiveBench

84.6%Aut.

Multilingual MMLU

80.7%Aut.

Internal API instruction following (hard)

50.0%Aut.

Language

COLLIE

98.7%Aut.

Long Context

OpenAI-MRCR: 2 needle 128k

18.7%Aut.

ComplexFuncBench

17.6%Aut.

Math

MATH

97.9%Aut.

MGSM

92.0%Aut.

AIME 2024

87.3%Aut.

FrontierMath

9.2%Aut.

Reasoning

Graphwalks parents <128k

58.3%Aut.

Graphwalks BFS <128k

51.0%Aut.

Indices d'évaluation AA

Coding Index

42.1

Intelligence Index

18.4

Math 500

1.0

Aime

0.9

Mmlu Pro

0.8

Gpqa

0.8

Livecodebench

0.7

Ifbench

0.7

Scicode

0.4

Lcr

0.4

Tau2

0.3

Hle

0.1

Terminalbench Hard

0.1

Scores par catégorie LLM Stats

Writing

100

Instruction Following

Language

Legal

Finance

Healthcare

Math

Physics

Biology

Chemistry

General

Reasoning

Structured Output

Spatial Reasoning

Frontend Development

Communication

Code

Tool Calling

Long Context

Factuality

Tarification

Prix d'entrée$1.1 / 1M tokens

Prix de sortie$4.4 / 1M tokens

Prix mixte (3:1)$1.925 / 1M tokens

Prix de lecture cache$0.55 / 1M tokens

Vitesse

Tokens/sec235.1

Délai du premier token20.86s

Temps de réponse20.86s

Classement des Prix par Fournisseur

9 fournisseurs

Moins cher: PoePlus cher: Merge Gateway

FournisseurEntréeSortie

1PoeMoins cher

$0.99

2OpenAIPRINCIPAL

$1.1

$4.4

3NanoGPT

$1.1

$4.4

4OpenRouter

$1.1

$4.4

5Kilo Gateway

$1.1

$4.4

6Cloudflare AI Gateway

$1.1

$4.4

7Vercel AI Gateway

$1.1

$4.4

8NEAR AI Cloud

$1.1

$4.4

9Merge Gateway

$1.1

$4.4

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

Artificial Analysis