o3-mini (high)
OpenAIOpenAI o-series
Описание
A smaller variant of O3, expected to offer enhanced multimodal capabilities, improved reasoning, and more efficient resource utilization compared to previous models while maintaining strong performance on core tasks.
Дата выхода
2025-01-31
Параметры
—
Длина контекста
200K
Модальности
text
Радар способностей
36
general
53
coding
88
reasoning
51
scienceоцен.
40
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 185 | 50.0 | AA |
| Общий рейтинг | 184 | 52.0 | AA |
| Математическое мышление | 20 | 95.0 | AA |
| Наука | 135 | 56.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
77.2%Сам.
Code
Aider-Polyglot
66.7%Сам.
Aider-Polyglot Edit
60.4%Сам.
SWE-Bench Verified
49.3%Сам.
SWE-Lancer
18.0%Сам.
SWE-Lancer (IC-Diamond subset)
7.4%Сам.
Communication
Multi-IF
79.5%Сам.
TAU-bench Retail
57.6%Сам.
Multi-Challenge
39.9%Сам.
TAU-bench Airline
32.4%Сам.
Factuality
SimpleQA
15.0%Сам.
Finance
MMLU
86.9%Сам.
General
IFEval
93.9%Сам.
LiveBench
84.6%Сам.
Multilingual MMLU
80.7%Сам.
Internal API instruction following (hard)
50.0%Сам.
Language
COLLIE
98.7%Сам.
Long Context
OpenAI-MRCR: 2 needle 128k
18.7%Сам.
ComplexFuncBench
17.6%Сам.
Math
MATH
97.9%Сам.
MGSM
92.0%Сам.
AIME 2024
87.3%Сам.
FrontierMath
9.2%Сам.
Reasoning
Graphwalks parents <128k
58.3%Сам.
Graphwalks BFS <128k
51.0%Сам.
Индексы оценки AA
Coding Index42.1
Intelligence Index18.4
Math 5001.0
Aime0.9
Mmlu Pro0.8
Gpqa0.8
Livecodebench0.7
Ifbench0.7
Scicode0.4
Lcr0.4
Tau20.3
Hle0.1
Terminalbench Hard0.1
Оценки категорий LLM Stats
Writing100
Instruction Following90
Language90
Legal90
Finance90
Healthcare90
Math80
Physics80
Biology80
Chemistry80
General70
Reasoning60
Structured Output60
Spatial Reasoning50
Frontend Development50
Communication50
Code40
Tool Calling40
Long Context20
Factuality10
Цены
Цена ввода$1.1 / 1M токенов
Цена вывода$4.4 / 1M токенов
Смешанная цена (3:1)$1.925 / 1M токенов
Цена чтения кэша$0.55 / 1M токенов
Скорость
Токенов/сек235.1
Задержка первого токена20.86s
Время до первого ответа20.86s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
9 провайдеров
Самый дешевый: PoeСамый дорогой: Merge Gateway
ПровайдерВводВывод
1PoeСамый дешевый
$0.99
$4
2OpenAIОсновной
$1.1
$4.4
3NanoGPT
$1.1
$4.4
4OpenRouter
$1.1
$4.4
5Kilo Gateway
$1.1
$4.4
6Cloudflare AI Gateway
$1.1
$4.4
7Vercel AI Gateway
$1.1
$4.4
8NEAR AI Cloud
$1.1
$4.4
9Merge Gateway
$1.1
$4.4
Сравнение цен разных API-провайдеров для этой модели.