GPT-5.3 Codex (xhigh)
OpenAIGPTProprietary
Description
GPT-5.3-Codex is OpenAI's most capable coding model, combining frontier agentic coding capabilities, improvements in aesthetics, and context compaction. It sets new state-of-the-art results on Terminal-Bench 2.0 (77.3%), OSWorld-Verified (64.7%), and SWE-Lancer IC Diamond (81.4%). First model classified as High capability for cybersecurity under OpenAI's Preparedness Framework. Available in the Codex app and API.
Date de sortie
2026-02-05
Paramètres
—
Longueur du contexte
400K
Modalités
file, image, text
Radar de capacités
51
general
53
coding
92
reasoning
68
scienceest.
80
agents
85
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Agents & Tools | 23 | 67.0 | LS |
| Code Ranking | 6 | 91.0 | AA |
| General Ranking | 13 | 88.0 | AA |
| Science | 7 | 92.0 | AA |
Scores de benchmarks (LLM Stats)
Agents
Terminal-Bench 2.0
77.3%Aut.
OSWorld-Verified
64.7%Aut.
SWE-Bench Pro
56.8%Aut.
Code
SWE-Lancer (IC-Diamond subset)
81.4%Aut.
Safety
Cybersecurity CTFs
77.6%Aut.
Indices d'évaluation AA
Intelligence Index53.6
Coding Index53.1
Gpqa0.9
Tau20.9
Ifbench0.8
Lcr0.7
Scicode0.5
Terminalbench Hard0.5
Hle0.4
Scores par catégorie LLM Stats
Tool Calling80
Safety80
Agents70
Code70
Reasoning70
Vision60
General60
Multimodal60
Tarification
Prix d'entrée$1.75 / 1M tokens
Prix de sortie$14 / 1M tokens
Prix mixte (3:1)$4.813 / 1M tokens
Vitesse
Tokens/sec83.3 tokens/s
Délai du premier token58.63s
Temps de réponse58.63s
Fournisseurs disponibles
(Unités internes LS)| Fournisseur | Prix d'entrée | Prix de sortie |
|---|---|---|
| OpenAI | 1.8M | 14.0M |