GPT-4.5 (Preview)
OpenAIGPTProprietary
설명
GPT-4.5 is OpenAI's most advanced model, offering improved reasoning, coding, and creative capabilities with faster performance and longer context handling than GPT-4. It features enhanced instruction following, reduced hallucinations, and better factual accuracy.
출시일
2025-02-27
파라미터
—
컨텍스트 길이
—
모달리티
image, text
능력 레이더
20
general
50
coding
80
reasoning
60
science추정
60
agents
70
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| General Ranking | 378 | 28.0 | AA |
| Multimodal Ranking | 47 | 75.0 | LS |
| Reasoning | 40 | 73.0 | LS |
벤치마크 점수 (LLM Stats)
Biology
GPQA
69.5%자체 보고
Code
HumanEval
88.0%자체 보고
Aider-Polyglot Edit
44.9%자체 보고
SWE-Bench Verified
38.0%자체 보고
SWE-Lancer
37.3%자체 보고
SWE-Lancer (IC-Diamond subset)
17.4%자체 보고
Communication
Multi-IF
70.8%자체 보고
TAU-bench Retail
68.4%자체 보고
TAU-bench Airline
50.0%자체 보고
Multi-Challenge
43.8%자체 보고
Factuality
SimpleQA
62.5%자체 보고
Finance
MMLU
90.8%자체 보고
General
IFEval
88.2%자체 보고
MMMLU
85.1%자체 보고
MMMU
75.2%자체 보고
Internal API instruction following (hard)
54.0%자체 보고
Language
COLLIE
72.3%자체 보고
Long Context
ComplexFuncBench
63.0%자체 보고
OpenAI-MRCR: 2 needle 128k
38.5%자체 보고
Math
GSM8k
97.0%자체 보고
MathVista
72.3%자체 보고
AIME 2024
36.7%자체 보고
Multimodal
CharXiv-D
90.0%자체 보고
CharXiv-R
55.4%자체 보고
Reasoning
Graphwalks parents <128k
72.6%자체 보고
Graphwalks BFS <128k
72.3%자체 보고
AA 평가 지수
Intelligence Index20.0
LLM Stats 카테고리 점수
Finance90
Legal90
Healthcare80
Instruction Following80
Language80
Math80
Spatial Reasoning70
Structured Output70
Vision70
Writing70
Biology70
Chemistry70
General70
Multimodal70
Physics70
Tool Calling60
Communication60
Factuality60
Reasoning60
Code50
Long Context50
Frontend Development40
가격
입력 가격무료
출력 가격무료
혼합 가격 (3:1)무료
속도
토큰/초0.0 tokens/s
첫 토큰 지연0.00s
첫 응답 지연0.00s
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다