o3
OpenAIOpenAI o-seriesProprietary
Описание
OpenAI's most powerful reasoning model. o3 is a well-rounded and powerful model across domains. It sets a new standard for math, science, coding, and visual reasoning tasks. It also excels at technical writing and instruction-following. Use it to think through multi-step problems that involve analysis across text, code, and images.
Дата выхода
2025-04-16
Параметры
—
Длина контекста
200K
Модальности
image, pdf, text
Радар способностей
45
general
72
coding
90
reasoning
56
scienceоцен.
70
agents
85
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Агентные возможности | 48 | 57.0 | LS |
| Рейтинг кодинга | 30 | 80.0 | AA |
| Общий рейтинг | 64 | 72.0 | AA |
| Математическое мышление | 28 | 92.0 | AA |
| Мультимодальный рейтинг | 38 | 79.0 | LS |
| Рассуждения | 86 | 53.0 | LS |
| Наука | 87 | 63.0 | AA |
Оценки бенчмарков (LLM Stats)
Agents
Tau-bench
63.0%Сам.
BrowseComp
49.7%Сам.
Biology
GPQA
83.3%Сам.
Code
Aider-Polyglot
81.3%Сам.
SWE-Bench Verified
69.1%Сам.
Communication
Tau2 Retail
80.2%Сам.
Tau2 Airline
64.8%Сам.
Multi-Challenge
60.4%Сам.
Tau2 Telecom
58.2%Сам.
General
MMMU
82.9%Сам.
MMMU-Pro
76.4%Сам.
Healthcare
VideoMMMU
83.3%Сам.
Language
COLLIE
98.4%Сам.
Math
AIME 2024
91.6%Сам.
MathVista
86.8%Сам.
AIME 2025
86.4%Сам.
FrontierMath
15.8%Сам.
Humanity's Last Exam
14.7%Сам.
Multimodal
CharXiv-R
78.6%Сам.
Reasoning
ARC-AGI
88.0%Сам.
ERQA
64.0%Сам.
ARC-AGI v2
6.5%Сам.
Индексы оценки AA
Math Index88.3
Intelligence Index30.4
Math 5001.0
Aime0.9
Aime 250.9
Mmlu Pro0.9
Gpqa0.8
Livecodebench0.8
Tau20.8
Ifbench0.7
Lcr0.7
Scicode0.4
Terminalbench Hard0.4
Hle0.2
Оценки категорий LLM Stats
Language100
Writing100
Multimodal80
Physics80
General80
Healthcare80
Biology80
Chemistry80
Code80
Reasoning70
Frontend Development70
Communication70
Tool Calling70
Math60
Agents60
Vision60
Search50
Spatial Reasoning50
Цены
Цена ввода$2 / 1M токенов
Цена вывода$8 / 1M токенов
Смешанная цена (3:1)$3.5 / 1M токенов
Цена чтения кэша$0.5 / 1M токенов
Скорость
Токенов/сек168.9
Задержка первого токена6.19s
Время до первого ответа6.19s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
16 провайдеров
Самый дешевый: PoeСамый дорогой: Jiekou.AI
ПровайдерВводВывод
1PoeСамый дешевый
$1.8
$7.2
2OpenAIОсновной
$2
$8
3NanoGPT
$2
$8
4Abacus
$2
$8
5OpenRouter
$2
$8
6Kilo Gateway
$2
$8
7Cloudflare AI Gateway
$2
$8
8Helicone
$2
$8
9Azure Cognitive Services
$2
$8
10DigitalOcean
$2
$8
11Vercel AI Gateway
$2
$8
12LLM Gateway
$2
$8
13Azure
$2
$8
14NEAR AI Cloud
$2
$8
15Merge Gateway
$2
$8
16Jiekou.AI
$10
$40
Сравнение цен разных API-провайдеров для этой модели.