o4-mini (high)
OpenAIOpenAI o-seriesProprietary
Descripción
o4-mini is OpenAI's latest small o-series model, optimized for fast, effective reasoning with exceptionally efficient performance in coding and visual tasks. It is faster and more affordable than o3.
Fecha de lanzamiento
2025-04-16
Parámetros
—
Longitud del contexto
200K
Modalidades
file, image, text
Radar de capacidades
46
general
49
coding
92
reasoning
55
scienceest.
60
agents
85
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Agents & Tools | 70 | 52.0 | LS |
| Code Ranking | 118 | 56.0 | AA |
| General Ranking | 105 | 66.0 | AA |
| Math Reasoning | 18 | 95.0 | AA |
| Multimodal Ranking | 57 | 72.0 | LS |
| Science | 76 | 66.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Agents
BrowseComp
51.5%Aut.
Biology
GPQA
81.4%Aut.
Code
Aider-Polyglot
68.9%Aut.
SWE-Bench Verified
68.1%Aut.
Aider-Polyglot Edit
58.2%Aut.
Communication
TAU-bench Retail
71.8%Aut.
TAU-bench Airline
49.2%Aut.
Multi-Challenge
43.0%Aut.
General
MMMU
81.6%Aut.
Math
AIME 2024
93.4%Aut.
AIME 2025
92.7%Aut.
MathVista
84.3%Aut.
Humanity's Last Exam
14.7%Aut.
Multimodal
CharXiv-R
72.0%Aut.
Índices de evaluación AA
Math Index90.7
Intelligence Index33.1
Coding Index25.6
Math 5001.0
Aime0.9
Aime 250.9
Livecodebench0.9
Mmlu Pro0.8
Gpqa0.8
Ifbench0.7
Tau20.6
Lcr0.6
Scicode0.5
Hle0.2
Terminalbench Hard0.2
Puntuaciones por categoría LLM Stats
Biology80
Chemistry80
Healthcare80
Multimodal80
Physics80
Code70
Frontend Development70
General70
Math70
Reasoning70
Tool Calling60
Vision60
Agents50
Communication50
Search50
Precios
Precio de entrada$1.1 / 1M tokens
Precio de salida$4.4 / 1M tokens
Precio mixto (3:1)$1.925 / 1M tokens
Velocidad
Tokens/seg129.4 tokens/s
Retraso del primer token29.37s
Tiempo hasta la respuesta29.37s
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles