o3-mini
OpenAIOpenAI o-seriesProprietary
Описание
A smaller variant of O3, expected to offer enhanced multimodal capabilities, improved reasoning, and more efficient resource utilization compared to previous models while maintaining strong performance on core tasks.
Дата выхода
2025-01-31
Параметры
—
Длина контекста
200K
Модальности
file, text
Радар способностей
39
general
39
coding
83
reasoning
49
scienceоцен.
40
agents
85
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 230 | 37.0 | AA |
| General Ranking | 214 | 48.0 | AA |
| Math Reasoning | 50 | 89.0 | AA |
| Reasoning | 78 | 54.0 | LS |
| Science | 146 | 54.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
77.2%Сам.
Code
Aider-Polyglot
66.7%Сам.
Aider-Polyglot Edit
60.4%Сам.
SWE-Bench Verified
49.3%Сам.
SWE-Lancer
18.0%Сам.
SWE-Lancer (IC-Diamond subset)
7.4%Сам.
Communication
Multi-IF
79.5%Сам.
TAU-bench Retail
57.6%Сам.
Multi-Challenge
39.9%Сам.
TAU-bench Airline
32.4%Сам.
Factuality
SimpleQA
15.0%Сам.
Finance
MMLU
86.9%Сам.
General
IFEval
93.9%Сам.
LiveBench
84.6%Сам.
Multilingual MMLU
80.7%Сам.
Internal API instruction following (hard)
50.0%Сам.
Language
COLLIE
98.7%Сам.
Long Context
OpenAI-MRCR: 2 needle 128k
18.7%Сам.
ComplexFuncBench
17.6%Сам.
Math
MATH
97.9%Сам.
MGSM
92.0%Сам.
AIME 2024
87.3%Сам.
FrontierMath
9.2%Сам.
Reasoning
Graphwalks parents <128k
58.3%Сам.
Graphwalks BFS <128k
51.0%Сам.
Индексы оценки AA
Intelligence Index25.9
Coding Index17.9
Math 5001.0
Mmlu Pro0.8
Aime0.8
Gpqa0.7
Livecodebench0.7
Scicode0.4
Tau20.3
Hle0.1
Terminalbench Hard0.1
Оценки категорий LLM Stats
Writing100
Finance90
Healthcare90
Instruction Following90
Language90
Legal90
Biology80
Chemistry80
Math80
Physics80
General70
Structured Output60
Reasoning60
Spatial Reasoning50
Communication50
Frontend Development50
Tool Calling40
Code40
Long Context20
Factuality10
Цены
Цена ввода$1.1 / 1M tokens
Цена вывода$4.4 / 1M tokens
Смешанная цена (3:1)$1.925 / 1M tokens
Скорость
Токенов/сек135.1 tokens/s
Задержка первого токена10.07s
Время до первого ответа10.07s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров