o1

OpenAIOpenAI o-seriesProprietary

Описание

A research preview model focused on mathematical and logical reasoning capabilities, demonstrating improved performance on tasks requiring step-by-step reasoning, mathematical problem-solving, and code generation. The model shows enhanced capabilities in formal reasoning while maintaining strong general capabilities.

Дата выхода

2024-12-05

Параметры

—

Длина контекста

200K

Модальности

image, pdf, text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	151	55.0	AA
Общий рейтинг	105	63.0	AA
Математическое мышление	55	87.0	AA
Наука	195	49.0	AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA

78.0%Сам.

GPQA Biology

69.2%Сам.

Chemistry

GPQA Chemistry

64.7%Сам.

Code

HumanEval

88.1%Сам.

SWE-Bench Verified

41.0%Сам.

Communication

TAU-bench Retail

70.8%Сам.

TAU-bench Airline

50.0%Сам.

Factuality

SimpleQA

47.0%Сам.

Finance

MMLU

91.8%Сам.

General

MMMLU

87.7%Сам.

MMMU

77.6%Сам.

LiveBench

67.0%Сам.

Math

GSM8k

97.1%Сам.

MATH

96.4%Сам.

MGSM

89.3%Сам.

AIME 2024

74.3%Сам.

MathVista

71.8%Сам.

FrontierMath

5.5%Сам.

Physics

GPQA Physics

92.8%Сам.

Индексы оценки AA

Coding Index

39.7

Intelligence Index

23.4

Math 500

1.0

Mmlu Pro

0.8

Gpqa

0.7

Aime

0.7

Ifbench

0.7

Livecodebench

0.7

Tau2

0.6

Lcr

0.6

Scicode

0.4

Terminalbench Hard

0.1

Hle

0.1

Оценки категорий LLM Stats

Language

Legal

Finance

Math

Physics

Healthcare

Biology

Chemistry

Multimodal

Reasoning

General

Vision

Code

Communication

Tool Calling

Factuality

Frontend Development

Цены

Цена ввода$15 / 1M токенов

Цена вывода$60 / 1M токенов

Смешанная цена (3:1)$26.25 / 1M токенов

Цена чтения кэша$7.5 / 1M токенов

Скорость

Токенов/сек147.9

Задержка первого токена13.04s

Время до первого ответа13.04s

Рейтинг цен провайдеров

13 провайдеров

Самый дешевый: PoeСамый дорогой: Merge Gateway

ПровайдерВводВывод

1PoeСамый дешевый

$14

$54

2NanoGPT

$14.994

$59.993

3OpenAIОсновной

$15

$60

4OpenRouter

$15

$60

5Kilo Gateway

$15

$60

6Cloudflare AI Gateway

$15

$60

7Helicone

$15

$60

8Azure Cognitive Services

$15

$60

9DigitalOcean

$15

$60

10Vercel AI Gateway

$15

$60

11LLM Gateway

$15

$60

12Azure

$15

$60

13Merge Gateway

$15

$60

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis