Saltar al contenido principal

o3-mini

OpenAIOpenAI o-seriesProprietary

Descripción

A smaller variant of O3, expected to offer enhanced multimodal capabilities, improved reasoning, and more efficient resource utilization compared to previous models while maintaining strong performance on core tasks.

Fecha de lanzamiento
2025-01-31
Parámetros
Longitud del contexto
200K
Modalidades
text

Radar de capacidades

35
general
65
coding
83
reasoning
49
scienceest.
40
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking de codificación217
45.0
AA
Ranking general234
45.0
AA
Razonamiento matemático50
89.0
AA
Razonamiento83
54.0
LS
Ciencia168
52.0
AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA77.2%Aut.

Code

Aider-Polyglot66.7%Aut.
Aider-Polyglot Edit60.4%Aut.
SWE-Bench Verified49.3%Aut.
SWE-Lancer18.0%Aut.
SWE-Lancer (IC-Diamond subset)7.4%Aut.

Communication

Multi-IF79.5%Aut.
TAU-bench Retail57.6%Aut.
Multi-Challenge39.9%Aut.
TAU-bench Airline32.4%Aut.

Factuality

SimpleQA15.0%Aut.

Finance

MMLU86.9%Aut.

General

IFEval93.9%Aut.
LiveBench84.6%Aut.
Multilingual MMLU80.7%Aut.
Internal API instruction following (hard)50.0%Aut.

Language

COLLIE98.7%Aut.

Long Context

OpenAI-MRCR: 2 needle 128k18.7%Aut.
ComplexFuncBench17.6%Aut.

Math

MATH97.9%Aut.
MGSM92.0%Aut.
AIME 202487.3%Aut.
FrontierMath9.2%Aut.

Reasoning

Graphwalks parents <128k58.3%Aut.
Graphwalks BFS <128k51.0%Aut.

Índices de evaluación AA

Intelligence Index
19.0
Math 500
1.0
Mmlu Pro
0.8
Aime
0.8
Gpqa
0.7
Livecodebench
0.7
Scicode
0.4
Tau2
0.3
Hle
0.1
Terminalbench Hard
0.1

Puntuaciones por categoría LLM Stats

Writing
100
Instruction Following
90
Language
90
Legal
90
Finance
90
Healthcare
90
Math
80
Physics
80
Biology
80
Chemistry
80
General
70
Reasoning
60
Structured Output
60
Spatial Reasoning
50
Frontend Development
50
Communication
50
Code
40
Tool Calling
40
Long Context
20
Factuality
10

Precios

Precio de entrada$1.1 / 1M tokens
Precio de salida$4.4 / 1M tokens
Precio mixto (3:1)$1.925 / 1M tokens
Precio de lectura caché$0.55 / 1M tokens

Velocidad

Tokens/seg229.8
Retraso del primer token5.43s
Tiempo hasta la respuesta5.43s

Ranking de Precios por Proveedor

Ranking de Precios por Proveedor

9 proveedores

Más barato: NanoGPTMás caro: Azure
ProveedorEntradaSalida
1NanoGPTMás barato
$1.088
$4.3996
2OpenAIPRINCIPAL
$1.1
$4.4
3Abacus
$1.1
$4.4
4Jiekou.AI
$1.1
$4.4
5Helicone
$1.1
$4.4
6Azure Cognitive Services
$1.1
$4.4
7DigitalOcean
$1.1
$4.4
8LLM Gateway
$1.1
$4.4
9Azure
$1.1
$4.4

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas