o1-preview
OpenAIOpenAI o-seriesProprietary
Описание
A research preview model focused on mathematical and logical reasoning capabilities, demonstrating improved performance on tasks requiring step-by-step reasoning, mathematical problem-solving, and code generation. The model shows enhanced capabilities in formal reasoning while maintaining strong general capabilities.
Дата выхода
2024-09-12
Параметры
—
Длина контекста
200K
Модальности
file, image, text
Радар способностей
24
general
34
coding
92
reasoning
60
scienceоцен.
0
agents
80
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 109 | 58.0 | AA |
| General Ranking | 325 | 34.0 | AA |
| Math Reasoning | 27 | 93.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
73.3%Сам.
Code
SWE-Bench Verified
41.3%Сам.
Factuality
SimpleQA
42.4%Сам.
Finance
MMLU
90.8%Сам.
General
LiveBench
52.3%Сам.
Math
MGSM
90.8%Сам.
MATH
85.5%Сам.
AIME 2024
42.0%Сам.
Индексы оценки AA
Coding Index34.0
Intelligence Index23.7
Math 5000.9
Оценки категорий LLM Stats
Finance90
Healthcare90
Language90
Legal90
Biology70
Chemistry70
Math70
Physics70
General60
Reasoning60
Code40
Factuality40
Frontend Development40
Цены
Цена ввода$16.5 / 1M tokens
Цена вывода$66 / 1M tokens
Смешанная цена (3:1)$28.875 / 1M tokens
Скорость
Токенов/сек0.0 tokens/s
Задержка первого токена0.00s
Время до первого ответа0.00s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров