o1
OpenAIOpenAI o-seriesProprietary
Описание
A research preview model focused on mathematical and logical reasoning capabilities, demonstrating improved performance on tasks requiring step-by-step reasoning, mathematical problem-solving, and code generation. The model shows enhanced capabilities in formal reasoning while maintaining strong general capabilities.
Дата выхода
2024-12-05
Параметры
—
Длина контекста
200K
Модальности
image, pdf, text
Радар способностей
39
general
49
coding
80
reasoning
48
scienceоцен.
60
agents
70
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 151 | 55.0 | AA |
| Общий рейтинг | 105 | 63.0 | AA |
| Математическое мышление | 55 | 87.0 | AA |
| Наука | 195 | 49.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
78.0%Сам.
GPQA Biology
69.2%Сам.
Chemistry
GPQA Chemistry
64.7%Сам.
Code
HumanEval
88.1%Сам.
SWE-Bench Verified
41.0%Сам.
Communication
TAU-bench Retail
70.8%Сам.
TAU-bench Airline
50.0%Сам.
Factuality
SimpleQA
47.0%Сам.
Finance
MMLU
91.8%Сам.
General
MMMLU
87.7%Сам.
MMMU
77.6%Сам.
LiveBench
67.0%Сам.
Math
GSM8k
97.1%Сам.
MATH
96.4%Сам.
MGSM
89.3%Сам.
AIME 2024
74.3%Сам.
MathVista
71.8%Сам.
FrontierMath
5.5%Сам.
Physics
GPQA Physics
92.8%Сам.
Индексы оценки AA
Coding Index39.7
Intelligence Index23.4
Math 5001.0
Mmlu Pro0.8
Gpqa0.7
Aime0.7
Ifbench0.7
Livecodebench0.7
Tau20.6
Lcr0.6
Scicode0.4
Terminalbench Hard0.1
Hle0.1
Оценки категорий LLM Stats
Language90
Legal90
Finance90
Math80
Physics80
Healthcare80
Biology80
Chemistry80
Multimodal70
Reasoning70
General70
Vision70
Code60
Communication60
Tool Calling60
Factuality50
Frontend Development40
Цены
Цена ввода$15 / 1M токенов
Цена вывода$60 / 1M токенов
Смешанная цена (3:1)$26.25 / 1M токенов
Цена чтения кэша$7.5 / 1M токенов
Скорость
Токенов/сек147.9
Задержка первого токена13.04s
Время до первого ответа13.04s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
13 провайдеров
Самый дешевый: PoeСамый дорогой: Merge Gateway
ПровайдерВводВывод
1PoeСамый дешевый
$14
$54
2NanoGPT
$14.994
$59.993
3OpenAIОсновной
$15
$60
4OpenRouter
$15
$60
5Kilo Gateway
$15
$60
6Cloudflare AI Gateway
$15
$60
7Helicone
$15
$60
8Azure Cognitive Services
$15
$60
9DigitalOcean
$15
$60
10Vercel AI Gateway
$15
$60
11LLM Gateway
$15
$60
12Azure
$15
$60
13Merge Gateway
$15
$60
Сравнение цен разных API-провайдеров для этой модели.