Перейти к основному содержанию

GPT-5 (high)

OpenAIGPTProprietary

Описание

GPT-5 is a flagship model from OpenAI designed for coding, reasoning, and agentic tasks across domains. It is optimized for coding and agentic tasks with higher reasoning capabilities and medium speed.

Дата выхода
2025-08-07
Параметры
Длина контекста
400K
Модальности
file, image, text

Радар способностей

55
general
54
coding
95
reasoning
59
scienceоцен.
80
agents
90
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Agents & Tools57
55.0
LS
Code Ranking47
74.0
AA
General Ranking34
83.0
AA
Math Reasoning6
97.0
AA
Multimodal Ranking21
84.0
LS
Reasoning41
72.0
LS
Science41
74.0
AA

Оценки бенчмарков (LLM Stats)

Agents

BrowseComp54.9%Сам.

Biology

GPQA85.7%Сам.

Code

SWE-Lancer (IC-Diamond subset)100.0%Сам.
HumanEval93.4%Сам.
Aider-Polyglot88.0%Сам.
SWE-Bench Verified74.9%Сам.

Communication

Tau2 Telecom96.7%Сам.
Tau2 Retail81.1%Сам.
Multi-Challenge69.6%Сам.
Tau2 Airline62.6%Сам.

Finance

MMLU92.5%Сам.

General

MMMU84.2%Сам.
MMMU-Pro78.4%Сам.
Internal API instruction following (hard)64.0%Сам.
LongFact Objects0.8%Сам.
LongFact Concepts0.7%Сам.

Healthcare

VideoMMMU84.6%Сам.
HealthBench Hard1.6%Сам.

Language

COLLIE99.0%Сам.

Long Context

OpenAI-MRCR: 2 needle 128k95.2%Сам.
OpenAI-MRCR: 2 needle 256k86.8%Сам.

Math

AIME 202594.6%Сам.
HMMT 202593.3%Сам.
MATH84.7%Сам.
FrontierMath26.3%Сам.
Humanity's Last Exam24.8%Сам.

Multimodal

VideoMME w sub.86.7%Сам.
CharXiv-R81.1%Сам.

Reasoning

BrowseComp Long Context 128k90.0%Сам.
BrowseComp Long Context 256k88.8%Сам.
Graphwalks BFS <128k78.3%Сам.
Graphwalks parents <128k73.3%Сам.
ERQA65.7%Сам.
FActScore1.0%Сам.

Индексы оценки AA

Math Index
94.3
Intelligence Index
44.6
Coding Index
36.0
Math 500
1.0
Aime
1.0
Aime 25
0.9
Mmlu Pro
0.9
Gpqa
0.9
Tau2
0.8
Livecodebench
0.8
Lcr
0.8
Ifbench
0.7
Scicode
0.4
Terminalbench Hard
0.3
Hle
0.3

Оценки категорий LLM Stats

Robotics
20
Spatial Reasoning
6
Multimodal
4
Vision
3
Reasoning
2
Writing
100
Language
100
Long Context
100
Video
90
Biology
90
Chemistry
90
Code
90
Finance
90
Legal
90
Physics
90
Tool Calling
80
Communication
80
General
80
Frontend Development
70
Healthcare
70
Math
70
Search
70
Structured Output
60
Agents
50

Цены

Цена ввода$1.25 / 1M tokens
Цена вывода$10 / 1M tokens
Смешанная цена (3:1)$3.438 / 1M tokens

Скорость

Токенов/сек95.3 tokens/s
Задержка первого токена98.86s
Время до первого ответа98.86s

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки