Saltar al contenido principal

o3

OpenAIOpenAI o-seriesProprietary

Descripción

OpenAI's most powerful reasoning model. o3 is a well-rounded and powerful model across domains. It sets a new standard for math, science, coding, and visual reasoning tasks. It also excels at technical writing and instruction-following. Use it to think through multi-step problems that involve analysis across text, code, and images.

Fecha de lanzamiento
2025-04-16
Parámetros
Longitud del contexto
200K
Modalidades
image, pdf, text

Radar de capacidades

45
general
72
coding
90
reasoning
56
scienceest.
70
agents
85
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Capacidad agéntica48
57.0
LS
Ranking de codificación30
80.0
AA
Ranking general64
72.0
AA
Razonamiento matemático28
92.0
AA
Ranking multimodal38
79.0
LS
Razonamiento86
53.0
LS
Ciencia87
63.0
AA

Puntuaciones de benchmarks (LLM Stats)

Agents

Tau-bench63.0%Aut.
BrowseComp49.7%Aut.

Biology

GPQA83.3%Aut.

Code

Aider-Polyglot81.3%Aut.
SWE-Bench Verified69.1%Aut.

Communication

Tau2 Retail80.2%Aut.
Tau2 Airline64.8%Aut.
Multi-Challenge60.4%Aut.
Tau2 Telecom58.2%Aut.

General

MMMU82.9%Aut.
MMMU-Pro76.4%Aut.

Healthcare

VideoMMMU83.3%Aut.

Language

COLLIE98.4%Aut.

Math

AIME 202491.6%Aut.
MathVista86.8%Aut.
AIME 202586.4%Aut.
FrontierMath15.8%Aut.
Humanity's Last Exam14.7%Aut.

Multimodal

CharXiv-R78.6%Aut.

Reasoning

ARC-AGI88.0%Aut.
ERQA64.0%Aut.
ARC-AGI v26.5%Aut.

Índices de evaluación AA

Math Index
88.3
Intelligence Index
30.4
Math 500
1.0
Aime
0.9
Aime 25
0.9
Mmlu Pro
0.9
Gpqa
0.8
Livecodebench
0.8
Tau2
0.8
Ifbench
0.7
Lcr
0.7
Scicode
0.4
Terminalbench Hard
0.4
Hle
0.2

Puntuaciones por categoría LLM Stats

Language
100
Writing
100
Multimodal
80
Physics
80
General
80
Healthcare
80
Biology
80
Chemistry
80
Code
80
Reasoning
70
Frontend Development
70
Communication
70
Tool Calling
70
Math
60
Agents
60
Vision
60
Search
50
Spatial Reasoning
50

Precios

Precio de entrada$2 / 1M tokens
Precio de salida$8 / 1M tokens
Precio mixto (3:1)$3.5 / 1M tokens
Precio de lectura caché$0.5 / 1M tokens

Velocidad

Tokens/seg168.9
Retraso del primer token6.19s
Tiempo hasta la respuesta6.19s

Ranking de Precios por Proveedor

Ranking de Precios por Proveedor

16 proveedores

Más barato: PoeMás caro: Jiekou.AI
ProveedorEntradaSalida
1PoeMás barato
$1.8
$7.2
2OpenAIPRINCIPAL
$2
$8
3NanoGPT
$2
$8
4Abacus
$2
$8
5OpenRouter
$2
$8
6Kilo Gateway
$2
$8
7Cloudflare AI Gateway
$2
$8
8Helicone
$2
$8
9Azure Cognitive Services
$2
$8
10DigitalOcean
$2
$8
11Vercel AI Gateway
$2
$8
12LLM Gateway
$2
$8
13Azure
$2
$8
14NEAR AI Cloud
$2
$8
15Merge Gateway
$2
$8
16Jiekou.AI
$10
$40

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas