GPT-5.3 Codex (xhigh)
OpenAIGPTProprietary
Descripción
GPT-5.3-Codex is OpenAI's most capable coding model, combining frontier agentic coding capabilities, improvements in aesthetics, and context compaction. It sets new state-of-the-art results on Terminal-Bench 2.0 (77.3%), OSWorld-Verified (64.7%), and SWE-Lancer IC Diamond (81.4%). First model classified as High capability for cybersecurity under OpenAI's Preparedness Framework. Available in the Codex app and API.
Fecha de lanzamiento
2026-02-05
Parámetros
—
Longitud del contexto
400K
Modalidades
file, image, text
Radar de capacidades
51
general
53
coding
92
reasoning
68
scienceest.
80
agents
85
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Agents & Tools | 23 | 67.0 | LS |
| Code Ranking | 6 | 91.0 | AA |
| General Ranking | 13 | 88.0 | AA |
| Science | 7 | 92.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Agents
Terminal-Bench 2.0
77.3%Aut.
OSWorld-Verified
64.7%Aut.
SWE-Bench Pro
56.8%Aut.
Code
SWE-Lancer (IC-Diamond subset)
81.4%Aut.
Safety
Cybersecurity CTFs
77.6%Aut.
Índices de evaluación AA
Intelligence Index53.6
Coding Index53.1
Gpqa0.9
Tau20.9
Ifbench0.8
Lcr0.7
Scicode0.5
Terminalbench Hard0.5
Hle0.4
Puntuaciones por categoría LLM Stats
Tool Calling80
Safety80
Agents70
Code70
Reasoning70
Vision60
General60
Multimodal60
Precios
Precio de entrada$1.75 / 1M tokens
Precio de salida$14 / 1M tokens
Precio mixto (3:1)$4.813 / 1M tokens
Velocidad
Tokens/seg83.3 tokens/s
Retraso del primer token58.63s
Tiempo hasta la respuesta58.63s
Proveedores disponibles
(Unidades internas LS)| Proveedor | Precio de entrada | Precio de salida |
|---|---|---|
| OpenAI | 1.8M | 14.0M |