o4-mini (high)
OpenAIOpenAI o-seriesProprietary
Description
o4-mini is OpenAI's latest small o-series model, optimized for fast, effective reasoning with exceptionally efficient performance in coding and visual tasks. It is faster and more affordable than o3.
Date de sortie
2025-04-16
Paramètres
—
Longueur du contexte
200K
Modalités
file, image, text
Radar de capacités
46
general
49
coding
92
reasoning
55
scienceest.
60
agents
85
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Agents & Tools | 70 | 52.0 | LS |
| Code Ranking | 118 | 56.0 | AA |
| General Ranking | 105 | 66.0 | AA |
| Math Reasoning | 18 | 95.0 | AA |
| Multimodal Ranking | 57 | 72.0 | LS |
| Science | 76 | 66.0 | AA |
Scores de benchmarks (LLM Stats)
Agents
BrowseComp
51.5%Aut.
Biology
GPQA
81.4%Aut.
Code
Aider-Polyglot
68.9%Aut.
SWE-Bench Verified
68.1%Aut.
Aider-Polyglot Edit
58.2%Aut.
Communication
TAU-bench Retail
71.8%Aut.
TAU-bench Airline
49.2%Aut.
Multi-Challenge
43.0%Aut.
General
MMMU
81.6%Aut.
Math
AIME 2024
93.4%Aut.
AIME 2025
92.7%Aut.
MathVista
84.3%Aut.
Humanity's Last Exam
14.7%Aut.
Multimodal
CharXiv-R
72.0%Aut.
Indices d'évaluation AA
Math Index90.7
Intelligence Index33.1
Coding Index25.6
Math 5001.0
Aime0.9
Aime 250.9
Livecodebench0.9
Mmlu Pro0.8
Gpqa0.8
Ifbench0.7
Tau20.6
Lcr0.6
Scicode0.5
Hle0.2
Terminalbench Hard0.2
Scores par catégorie LLM Stats
Biology80
Chemistry80
Healthcare80
Multimodal80
Physics80
Code70
Frontend Development70
General70
Math70
Reasoning70
Tool Calling60
Vision60
Agents50
Communication50
Search50
Tarification
Prix d'entrée$1.1 / 1M tokens
Prix de sortie$4.4 / 1M tokens
Prix mixte (3:1)$1.925 / 1M tokens
Vitesse
Tokens/sec129.4 tokens/s
Délai du premier token29.37s
Temps de réponse29.37s
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible