Перейти к основному содержанию

o1

OpenAIOpenAI o-seriesProprietary

Описание

A research preview model focused on mathematical and logical reasoning capabilities, demonstrating improved performance on tasks requiring step-by-step reasoning, mathematical problem-solving, and code generation. The model shows enhanced capabilities in formal reasoning while maintaining strong general capabilities.

Дата выхода
2024-12-05
Параметры
Длина контекста
200K
Модальности
image, pdf, text

Радар способностей

39
general
49
coding
80
reasoning
48
scienceоцен.
60
agents
70
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга151
55.0
AA
Общий рейтинг105
63.0
AA
Математическое мышление55
87.0
AA
Наука195
49.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA78.0%Сам.
GPQA Biology69.2%Сам.

Chemistry

GPQA Chemistry64.7%Сам.

Code

HumanEval88.1%Сам.
SWE-Bench Verified41.0%Сам.

Communication

TAU-bench Retail70.8%Сам.
TAU-bench Airline50.0%Сам.

Factuality

SimpleQA47.0%Сам.

Finance

MMLU91.8%Сам.

General

MMMLU87.7%Сам.
MMMU77.6%Сам.
LiveBench67.0%Сам.

Math

GSM8k97.1%Сам.
MATH96.4%Сам.
MGSM89.3%Сам.
AIME 202474.3%Сам.
MathVista71.8%Сам.
FrontierMath5.5%Сам.

Physics

GPQA Physics92.8%Сам.

Индексы оценки AA

Coding Index
39.7
Intelligence Index
23.4
Math 500
1.0
Mmlu Pro
0.8
Gpqa
0.7
Aime
0.7
Ifbench
0.7
Livecodebench
0.7
Tau2
0.6
Lcr
0.6
Scicode
0.4
Terminalbench Hard
0.1
Hle
0.1

Оценки категорий LLM Stats

Language
90
Legal
90
Finance
90
Math
80
Physics
80
Healthcare
80
Biology
80
Chemistry
80
Multimodal
70
Reasoning
70
General
70
Vision
70
Code
60
Communication
60
Tool Calling
60
Factuality
50
Frontend Development
40

Цены

Цена ввода$15 / 1M токенов
Цена вывода$60 / 1M токенов
Смешанная цена (3:1)$26.25 / 1M токенов
Цена чтения кэша$7.5 / 1M токенов

Скорость

Токенов/сек147.9
Задержка первого токена13.04s
Время до первого ответа13.04s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

13 провайдеров

Самый дешевый: PoeСамый дорогой: Merge Gateway
ПровайдерВводВывод
1PoeСамый дешевый
$14
$54
2NanoGPT
$14.994
$59.993
3OpenAIОсновной
$15
$60
4OpenRouter
$15
$60
5Kilo Gateway
$15
$60
6Cloudflare AI Gateway
$15
$60
7Helicone
$15
$60
8Azure Cognitive Services
$15
$60
9DigitalOcean
$15
$60
10Vercel AI Gateway
$15
$60
11LLM Gateway
$15
$60
12Azure
$15
$60
13Merge Gateway
$15
$60

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки