Passer au contenu principal

o3-mini (high)

OpenAIOpenAI o-series

Description

A smaller variant of O3, expected to offer enhanced multimodal capabilities, improved reasoning, and more efficient resource utilization compared to previous models while maintaining strong performance on core tasks.

Date de sortie
2025-01-31
Paramètres
Longueur du contexte
200K
Modalités
text

Radar de capacités

36
general
53
coding
88
reasoning
51
scienceest.
40
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement codage185
50.0
AA
Classement général184
52.0
AA
Raisonnement mathématique20
95.0
AA
Science135
56.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA77.2%Aut.

Code

Aider-Polyglot66.7%Aut.
Aider-Polyglot Edit60.4%Aut.
SWE-Bench Verified49.3%Aut.
SWE-Lancer18.0%Aut.
SWE-Lancer (IC-Diamond subset)7.4%Aut.

Communication

Multi-IF79.5%Aut.
TAU-bench Retail57.6%Aut.
Multi-Challenge39.9%Aut.
TAU-bench Airline32.4%Aut.

Factuality

SimpleQA15.0%Aut.

Finance

MMLU86.9%Aut.

General

IFEval93.9%Aut.
LiveBench84.6%Aut.
Multilingual MMLU80.7%Aut.
Internal API instruction following (hard)50.0%Aut.

Language

COLLIE98.7%Aut.

Long Context

OpenAI-MRCR: 2 needle 128k18.7%Aut.
ComplexFuncBench17.6%Aut.

Math

MATH97.9%Aut.
MGSM92.0%Aut.
AIME 202487.3%Aut.
FrontierMath9.2%Aut.

Reasoning

Graphwalks parents <128k58.3%Aut.
Graphwalks BFS <128k51.0%Aut.

Indices d'évaluation AA

Coding Index
42.1
Intelligence Index
18.4
Math 500
1.0
Aime
0.9
Mmlu Pro
0.8
Gpqa
0.8
Livecodebench
0.7
Ifbench
0.7
Scicode
0.4
Lcr
0.4
Tau2
0.3
Hle
0.1
Terminalbench Hard
0.1

Scores par catégorie LLM Stats

Writing
100
Instruction Following
90
Language
90
Legal
90
Finance
90
Healthcare
90
Math
80
Physics
80
Biology
80
Chemistry
80
General
70
Reasoning
60
Structured Output
60
Spatial Reasoning
50
Frontend Development
50
Communication
50
Code
40
Tool Calling
40
Long Context
20
Factuality
10

Tarification

Prix d'entrée$1.1 / 1M tokens
Prix de sortie$4.4 / 1M tokens
Prix mixte (3:1)$1.925 / 1M tokens
Prix de lecture cache$0.55 / 1M tokens

Vitesse

Tokens/sec235.1
Délai du premier token20.86s
Temps de réponse20.86s

Classement des Prix par Fournisseur

Classement des Prix par Fournisseur

9 fournisseurs

Moins cher: PoePlus cher: Merge Gateway
FournisseurEntréeSortie
1PoeMoins cher
$0.99
$4
2OpenAIPRINCIPAL
$1.1
$4.4
3NanoGPT
$1.1
$4.4
4OpenRouter
$1.1
$4.4
5Kilo Gateway
$1.1
$4.4
6Cloudflare AI Gateway
$1.1
$4.4
7Vercel AI Gateway
$1.1
$4.4
8NEAR AI Cloud
$1.1
$4.4
9Merge Gateway
$1.1
$4.4

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes