Перейти к основному содержанию

GPT-4.5 (Preview)

OpenAIGPTProprietary

Описание

GPT-4.5 is OpenAI's most advanced model, offering improved reasoning, coding, and creative capabilities with faster performance and longer context handling than GPT-4. It features enhanced instruction following, reduced hallucinations, and better factual accuracy.

Дата выхода
2025-02-27
Параметры
Длина контекста
Модальности
image, text

Радар способностей

20
general
50
coding
80
reasoning
60
scienceоцен.
60
agents
70
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
General Ranking378
28.0
AA
Multimodal Ranking47
75.0
LS
Reasoning40
73.0
LS

Оценки бенчмарков (LLM Stats)

Biology

GPQA69.5%Сам.

Code

HumanEval88.0%Сам.
Aider-Polyglot Edit44.9%Сам.
SWE-Bench Verified38.0%Сам.
SWE-Lancer37.3%Сам.
SWE-Lancer (IC-Diamond subset)17.4%Сам.

Communication

Multi-IF70.8%Сам.
TAU-bench Retail68.4%Сам.
TAU-bench Airline50.0%Сам.
Multi-Challenge43.8%Сам.

Factuality

SimpleQA62.5%Сам.

Finance

MMLU90.8%Сам.

General

IFEval88.2%Сам.
MMMLU85.1%Сам.
MMMU75.2%Сам.
Internal API instruction following (hard)54.0%Сам.

Language

COLLIE72.3%Сам.

Long Context

ComplexFuncBench63.0%Сам.
OpenAI-MRCR: 2 needle 128k38.5%Сам.

Math

GSM8k97.0%Сам.
MathVista72.3%Сам.
AIME 202436.7%Сам.

Multimodal

CharXiv-D90.0%Сам.
CharXiv-R55.4%Сам.

Reasoning

Graphwalks parents <128k72.6%Сам.
Graphwalks BFS <128k72.3%Сам.

Индексы оценки AA

Intelligence Index
20.0

Оценки категорий LLM Stats

Finance
90
Legal
90
Healthcare
80
Instruction Following
80
Language
80
Math
80
Spatial Reasoning
70
Structured Output
70
Vision
70
Writing
70
Biology
70
Chemistry
70
General
70
Multimodal
70
Physics
70
Tool Calling
60
Communication
60
Factuality
60
Reasoning
60
Code
50
Long Context
50
Frontend Development
40

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0 tokens/s
Задержка первого токена0.00s
Время до первого ответа0.00s

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки