GPT-5 (high)
OpenAIGPTProprietary
설명
GPT-5 is a flagship model from OpenAI designed for coding, reasoning, and agentic tasks across domains. It is optimized for coding and agentic tasks with higher reasoning capabilities and medium speed.
출시일
2025-08-07
파라미터
—
컨텍스트 길이
400K
모달리티
file, image, text
능력 레이더
55
general
54
coding
95
reasoning
59
science추정
80
agents
90
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Agents & Tools | 57 | 55.0 | LS |
| Code Ranking | 47 | 74.0 | AA |
| General Ranking | 34 | 83.0 | AA |
| Math Reasoning | 6 | 97.0 | AA |
| Multimodal Ranking | 21 | 84.0 | LS |
| Reasoning | 41 | 72.0 | LS |
| Science | 41 | 74.0 | AA |
벤치마크 점수 (LLM Stats)
Agents
BrowseComp
54.9%자체 보고
Biology
GPQA
85.7%자체 보고
Code
SWE-Lancer (IC-Diamond subset)
100.0%자체 보고
HumanEval
93.4%자체 보고
Aider-Polyglot
88.0%자체 보고
SWE-Bench Verified
74.9%자체 보고
Communication
Tau2 Telecom
96.7%자체 보고
Tau2 Retail
81.1%자체 보고
Multi-Challenge
69.6%자체 보고
Tau2 Airline
62.6%자체 보고
Finance
MMLU
92.5%자체 보고
General
MMMU
84.2%자체 보고
MMMU-Pro
78.4%자체 보고
Internal API instruction following (hard)
64.0%자체 보고
LongFact Objects
0.8%자체 보고
LongFact Concepts
0.7%자체 보고
Healthcare
VideoMMMU
84.6%자체 보고
HealthBench Hard
1.6%자체 보고
Language
COLLIE
99.0%자체 보고
Long Context
OpenAI-MRCR: 2 needle 128k
95.2%자체 보고
OpenAI-MRCR: 2 needle 256k
86.8%자체 보고
Math
AIME 2025
94.6%자체 보고
HMMT 2025
93.3%자체 보고
MATH
84.7%자체 보고
FrontierMath
26.3%자체 보고
Humanity's Last Exam
24.8%자체 보고
Multimodal
VideoMME w sub.
86.7%자체 보고
CharXiv-R
81.1%자체 보고
Reasoning
BrowseComp Long Context 128k
90.0%자체 보고
BrowseComp Long Context 256k
88.8%자체 보고
Graphwalks BFS <128k
78.3%자체 보고
Graphwalks parents <128k
73.3%자체 보고
ERQA
65.7%자체 보고
FActScore
1.0%자체 보고
AA 평가 지수
Math Index94.3
Intelligence Index44.6
Coding Index36.0
Math 5001.0
Aime1.0
Aime 250.9
Mmlu Pro0.9
Gpqa0.9
Tau20.8
Livecodebench0.8
Lcr0.8
Ifbench0.7
Scicode0.4
Terminalbench Hard0.3
Hle0.3
LLM Stats 카테고리 점수
Robotics20
Spatial Reasoning6
Multimodal4
Vision3
Reasoning2
Writing100
Language100
Long Context100
Video90
Biology90
Chemistry90
Code90
Finance90
Legal90
Physics90
Tool Calling80
Communication80
General80
Frontend Development70
Healthcare70
Math70
Search70
Structured Output60
Agents50
가격
입력 가격$1.25 / 1M tokens
출력 가격$10 / 1M tokens
혼합 가격 (3:1)$3.438 / 1M tokens
속도
토큰/초95.3 tokens/s
첫 토큰 지연98.86s
첫 응답 지연98.86s
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다