GPT-5 (high)

OpenAIGPTProprietary

Описание

GPT-5 is a flagship model from OpenAI designed for coding, reasoning, and agentic tasks across domains. It is optimized for coding and agentic tasks with higher reasoning capabilities and medium speed.

Дата выхода

2025-08-07

Параметры

—

Длина контекста

400K

Модальности

image, text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	26	81.0	AA
Общий рейтинг	35	78.0	AA
Математическое мышление	7	97.0	AA
Наука	55	70.0	AA

Оценки бенчмарков (LLM Stats)

Agents

BrowseComp

54.9%Сам.

Biology

GPQA

85.7%Сам.

Code

SWE-Lancer (IC-Diamond subset)

100.0%Сам.

HumanEval

93.4%Сам.

Aider-Polyglot

88.0%Сам.

SWE-Bench Verified

74.9%Сам.

Communication

Tau2 Telecom

96.7%Сам.

Tau2 Retail

81.1%Сам.

Multi-Challenge

69.6%Сам.

Tau2 Airline

62.6%Сам.

Finance

MMLU

92.5%Сам.

General

MMMU

84.2%Сам.

MMMU-Pro

78.4%Сам.

Internal API instruction following (hard)

64.0%Сам.

LongFact Objects

0.8%Сам.

LongFact Concepts

0.7%Сам.

Healthcare

VideoMMMU

84.6%Сам.

HealthBench Hard

1.6%Сам.

Language

COLLIE

99.0%Сам.

Long Context

OpenAI-MRCR: 2 needle 128k

95.2%Сам.

OpenAI-MRCR: 2 needle 256k

86.8%Сам.

Math

AIME 2025

94.6%Сам.

HMMT 2025

93.3%Сам.

MATH

84.7%Сам.

FrontierMath

26.3%Сам.

Humanity's Last Exam

24.8%Сам.

Multimodal

VideoMME w sub.

86.7%Сам.

CharXiv-R

81.1%Сам.

Reasoning

BrowseComp Long Context 128k

90.0%Сам.

BrowseComp Long Context 256k

88.8%Сам.

Graphwalks BFS <128k

78.3%Сам.

Graphwalks parents <128k

73.3%Сам.

ERQA

65.7%Сам.

FActScore

1.0%Сам.

Индексы оценки AA

Math Index

94.3

Intelligence Index

36.1

Math 500

1.0

Aime

1.0

Aime 25

0.9

Mmlu Pro

0.9

Gpqa

0.9

Tau2

0.8

Livecodebench

0.8

Lcr

0.8

Ifbench

0.7

Scicode

0.4

Terminalbench Hard

0.3

Hle

0.3

Оценки категорий LLM Stats

Language

100

Long Context

100

Writing

100

Legal

Physics

Finance

Biology

Chemistry

Code

Video

Reasoning

General

Communication

Tool Calling

Math

Multimodal

Frontend Development

Healthcare

Vision

Spatial Reasoning

Structured Output

Agents

Robotics

Цены

Цена ввода$1.25 / 1M токенов

Цена вывода$10 / 1M токенов

Смешанная цена (3:1)$3.438 / 1M токенов

Цена чтения кэша$0.125 / 1M токенов

Скорость

Токенов/сек122.7

Задержка первого токена100.26s

Время до первого ответа100.26s

Рейтинг цен провайдеров

12 провайдеров

Самый дешевый: PoeСамый дорогой: Merge Gateway

ПровайдерВводВывод

1PoeСамый дешевый

$1.1

2OpenAIОсновной

$1.25

$10

3NanoGPT

$1.25

$10

4OpenRouter

$1.25

$10

5ZenMux

$1.25

$10

6Kilo Gateway

$1.25

$10

7Requesty

$1.25

$10

8Vercel AI Gateway

$1.25

$10

9FastRouter

$1.25

$10

10NEAR AI Cloud

$1.25

$10

11OrcaRouter

$1.25

$10

12Merge Gateway

$1.25

$10

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis