Перейти к основному содержанию

o3

OpenAIOpenAI o-seriesProprietary

Описание

OpenAI's most powerful reasoning model. o3 is a well-rounded and powerful model across domains. It sets a new standard for math, science, coding, and visual reasoning tasks. It also excels at technical writing and instruction-following. Use it to think through multi-step problems that involve analysis across text, code, and images.

Дата выхода
2025-04-16
Параметры
Длина контекста
200K
Модальности
image, pdf, text

Радар способностей

45
general
72
coding
90
reasoning
56
scienceоцен.
70
agents
85
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Оценки бенчмарков (LLM Stats)

Agents

Tau-bench63.0%Сам.
BrowseComp49.7%Сам.

Biology

GPQA83.3%Сам.

Code

Aider-Polyglot81.3%Сам.
SWE-Bench Verified69.1%Сам.

Communication

Tau2 Retail80.2%Сам.
Tau2 Airline64.8%Сам.
Multi-Challenge60.4%Сам.
Tau2 Telecom58.2%Сам.

General

MMMU82.9%Сам.
MMMU-Pro76.4%Сам.

Healthcare

VideoMMMU83.3%Сам.

Language

COLLIE98.4%Сам.

Math

AIME 202491.6%Сам.
MathVista86.8%Сам.
AIME 202586.4%Сам.
FrontierMath15.8%Сам.
Humanity's Last Exam14.7%Сам.

Multimodal

CharXiv-R78.6%Сам.

Reasoning

ARC-AGI88.0%Сам.
ERQA64.0%Сам.
ARC-AGI v26.5%Сам.

Индексы оценки AA

Math Index
88.3
Intelligence Index
30.4
Math 500
1.0
Aime
0.9
Aime 25
0.9
Mmlu Pro
0.9
Gpqa
0.8
Livecodebench
0.8
Tau2
0.8
Ifbench
0.7
Lcr
0.7
Scicode
0.4
Terminalbench Hard
0.4
Hle
0.2

Оценки категорий LLM Stats

Language
100
Writing
100
Multimodal
80
Physics
80
General
80
Healthcare
80
Biology
80
Chemistry
80
Code
80
Reasoning
70
Frontend Development
70
Communication
70
Tool Calling
70
Math
60
Agents
60
Vision
60
Search
50
Spatial Reasoning
50

Цены

Цена ввода$2 / 1M токенов
Цена вывода$8 / 1M токенов
Смешанная цена (3:1)$3.5 / 1M токенов
Цена чтения кэша$0.5 / 1M токенов

Скорость

Токенов/сек168.9
Задержка первого токена6.19s
Время до первого ответа6.19s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

16 провайдеров

Самый дешевый: PoeСамый дорогой: Jiekou.AI
ПровайдерВводВывод
1PoeСамый дешевый
$1.8
$7.2
2OpenAIОсновной
$2
$8
3NanoGPT
$2
$8
4Abacus
$2
$8
5OpenRouter
$2
$8
6Kilo Gateway
$2
$8
7Cloudflare AI Gateway
$2
$8
8Helicone
$2
$8
9Azure Cognitive Services
$2
$8
10DigitalOcean
$2
$8
11Vercel AI Gateway
$2
$8
12LLM Gateway
$2
$8
13Azure
$2
$8
14NEAR AI Cloud
$2
$8
15Merge Gateway
$2
$8
16Jiekou.AI
$10
$40

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки