o4-mini (high)
OpenAIOpenAI o-seriesProprietary
Описание
o4-mini is OpenAI's latest small o-series model, optimized for fast, effective reasoning with exceptionally efficient performance in coding and visual tasks. It is faster and more affordable than o3.
Дата выхода
2025-04-16
Параметры
—
Длина контекста
200K
Модальности
file, image, text
Радар способностей
46
general
49
coding
92
reasoning
55
scienceоцен.
60
agents
85
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Agents & Tools | 70 | 52.0 | LS |
| Code Ranking | 118 | 56.0 | AA |
| General Ranking | 105 | 66.0 | AA |
| Math Reasoning | 18 | 95.0 | AA |
| Multimodal Ranking | 57 | 72.0 | LS |
| Science | 76 | 66.0 | AA |
Оценки бенчмарков (LLM Stats)
Agents
BrowseComp
51.5%Сам.
Biology
GPQA
81.4%Сам.
Code
Aider-Polyglot
68.9%Сам.
SWE-Bench Verified
68.1%Сам.
Aider-Polyglot Edit
58.2%Сам.
Communication
TAU-bench Retail
71.8%Сам.
TAU-bench Airline
49.2%Сам.
Multi-Challenge
43.0%Сам.
General
MMMU
81.6%Сам.
Math
AIME 2024
93.4%Сам.
AIME 2025
92.7%Сам.
MathVista
84.3%Сам.
Humanity's Last Exam
14.7%Сам.
Multimodal
CharXiv-R
72.0%Сам.
Индексы оценки AA
Math Index90.7
Intelligence Index33.1
Coding Index25.6
Math 5001.0
Aime0.9
Aime 250.9
Livecodebench0.9
Mmlu Pro0.8
Gpqa0.8
Ifbench0.7
Tau20.6
Lcr0.6
Scicode0.5
Hle0.2
Terminalbench Hard0.2
Оценки категорий LLM Stats
Biology80
Chemistry80
Healthcare80
Multimodal80
Physics80
Code70
Frontend Development70
General70
Math70
Reasoning70
Tool Calling60
Vision60
Agents50
Communication50
Search50
Цены
Цена ввода$1.1 / 1M tokens
Цена вывода$4.4 / 1M tokens
Смешанная цена (3:1)$1.925 / 1M tokens
Скорость
Токенов/сек129.4 tokens/s
Задержка первого токена29.37s
Время до первого ответа29.37s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров