GPT-4.5 (Preview)
OpenAIGPTProprietary
Описание
GPT-4.5 is OpenAI's most advanced model, offering improved reasoning, coding, and creative capabilities with faster performance and longer context handling than GPT-4. It features enhanced instruction following, reduced hallucinations, and better factual accuracy.
Дата выхода
2025-02-27
Параметры
—
Длина контекста
—
Модальности
image, text
Радар способностей
20
general
50
coding
80
reasoning
60
scienceоцен.
60
agents
70
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| General Ranking | 378 | 28.0 | AA |
| Multimodal Ranking | 47 | 75.0 | LS |
| Reasoning | 40 | 73.0 | LS |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
69.5%Сам.
Code
HumanEval
88.0%Сам.
Aider-Polyglot Edit
44.9%Сам.
SWE-Bench Verified
38.0%Сам.
SWE-Lancer
37.3%Сам.
SWE-Lancer (IC-Diamond subset)
17.4%Сам.
Communication
Multi-IF
70.8%Сам.
TAU-bench Retail
68.4%Сам.
TAU-bench Airline
50.0%Сам.
Multi-Challenge
43.8%Сам.
Factuality
SimpleQA
62.5%Сам.
Finance
MMLU
90.8%Сам.
General
IFEval
88.2%Сам.
MMMLU
85.1%Сам.
MMMU
75.2%Сам.
Internal API instruction following (hard)
54.0%Сам.
Language
COLLIE
72.3%Сам.
Long Context
ComplexFuncBench
63.0%Сам.
OpenAI-MRCR: 2 needle 128k
38.5%Сам.
Math
GSM8k
97.0%Сам.
MathVista
72.3%Сам.
AIME 2024
36.7%Сам.
Multimodal
CharXiv-D
90.0%Сам.
CharXiv-R
55.4%Сам.
Reasoning
Graphwalks parents <128k
72.6%Сам.
Graphwalks BFS <128k
72.3%Сам.
Индексы оценки AA
Intelligence Index20.0
Оценки категорий LLM Stats
Finance90
Legal90
Healthcare80
Instruction Following80
Language80
Math80
Spatial Reasoning70
Structured Output70
Vision70
Writing70
Biology70
Chemistry70
General70
Multimodal70
Physics70
Tool Calling60
Communication60
Factuality60
Reasoning60
Code50
Long Context50
Frontend Development40
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0 tokens/s
Задержка первого токена0.00s
Время до первого ответа0.00s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров