o3
OpenAIOpenAI o-seriesProprietary
Description
OpenAI's most powerful reasoning model. o3 is a well-rounded and powerful model across domains. It sets a new standard for math, science, coding, and visual reasoning tasks. It also excels at technical writing and instruction-following. Use it to think through multi-step problems that involve analysis across text, code, and images.
Date de sortie
2025-04-16
Paramètres
—
Longueur du contexte
200K
Modalités
image, pdf, text
Radar de capacités
45
general
72
coding
90
reasoning
56
scienceest.
70
agents
85
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Capacité agentique | 48 | 57.0 | LS |
| Classement codage | 30 | 80.0 | AA |
| Classement général | 64 | 72.0 | AA |
| Raisonnement mathématique | 28 | 92.0 | AA |
| Classement multimodal | 38 | 79.0 | LS |
| Raisonnement | 86 | 53.0 | LS |
| Science | 87 | 63.0 | AA |
Scores de benchmarks (LLM Stats)
Agents
Tau-bench
63.0%Aut.
BrowseComp
49.7%Aut.
Biology
GPQA
83.3%Aut.
Code
Aider-Polyglot
81.3%Aut.
SWE-Bench Verified
69.1%Aut.
Communication
Tau2 Retail
80.2%Aut.
Tau2 Airline
64.8%Aut.
Multi-Challenge
60.4%Aut.
Tau2 Telecom
58.2%Aut.
General
MMMU
82.9%Aut.
MMMU-Pro
76.4%Aut.
Healthcare
VideoMMMU
83.3%Aut.
Language
COLLIE
98.4%Aut.
Math
AIME 2024
91.6%Aut.
MathVista
86.8%Aut.
AIME 2025
86.4%Aut.
FrontierMath
15.8%Aut.
Humanity's Last Exam
14.7%Aut.
Multimodal
CharXiv-R
78.6%Aut.
Reasoning
ARC-AGI
88.0%Aut.
ERQA
64.0%Aut.
ARC-AGI v2
6.5%Aut.
Indices d'évaluation AA
Math Index88.3
Intelligence Index30.4
Math 5001.0
Aime0.9
Aime 250.9
Mmlu Pro0.9
Gpqa0.8
Livecodebench0.8
Tau20.8
Ifbench0.7
Lcr0.7
Scicode0.4
Terminalbench Hard0.4
Hle0.2
Scores par catégorie LLM Stats
Language100
Writing100
Multimodal80
Physics80
General80
Healthcare80
Biology80
Chemistry80
Code80
Reasoning70
Frontend Development70
Communication70
Tool Calling70
Math60
Agents60
Vision60
Search50
Spatial Reasoning50
Tarification
Prix d'entrée$2 / 1M tokens
Prix de sortie$8 / 1M tokens
Prix mixte (3:1)$3.5 / 1M tokens
Prix de lecture cache$0.5 / 1M tokens
Vitesse
Tokens/sec168.9
Délai du premier token6.19s
Temps de réponse6.19s
Classement des Prix par Fournisseur
Classement des Prix par Fournisseur
16 fournisseurs
Moins cher: PoePlus cher: Jiekou.AI
FournisseurEntréeSortie
1PoeMoins cher
$1.8
$7.2
2OpenAIPRINCIPAL
$2
$8
3NanoGPT
$2
$8
4Abacus
$2
$8
5OpenRouter
$2
$8
6Kilo Gateway
$2
$8
7Cloudflare AI Gateway
$2
$8
8Helicone
$2
$8
9Azure Cognitive Services
$2
$8
10DigitalOcean
$2
$8
11Vercel AI Gateway
$2
$8
12LLM Gateway
$2
$8
13Azure
$2
$8
14NEAR AI Cloud
$2
$8
15Merge Gateway
$2
$8
16Jiekou.AI
$10
$40
Comparer les prix entre différents fournisseurs API pour ce modèle.