GPT-5 (high)
OpenAIGPTProprietary
説明
GPT-5 is a flagship model from OpenAI designed for coding, reasoning, and agentic tasks across domains. It is optimized for coding and agentic tasks with higher reasoning capabilities and medium speed.
リリース日
2025-08-07
パラメータ
—
コンテキスト長
400K
モダリティ
file, image, text
能力レーダー
55
general
54
coding
95
reasoning
59
science推定
80
agents
90
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 57 | 55.0 | LS |
| Code Ranking | 47 | 74.0 | AA |
| General Ranking | 34 | 83.0 | AA |
| Math Reasoning | 6 | 97.0 | AA |
| Multimodal Ranking | 21 | 84.0 | LS |
| Reasoning | 41 | 72.0 | LS |
| Science | 41 | 74.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
BrowseComp
54.9%自己申告
Biology
GPQA
85.7%自己申告
Code
SWE-Lancer (IC-Diamond subset)
100.0%自己申告
HumanEval
93.4%自己申告
Aider-Polyglot
88.0%自己申告
SWE-Bench Verified
74.9%自己申告
Communication
Tau2 Telecom
96.7%自己申告
Tau2 Retail
81.1%自己申告
Multi-Challenge
69.6%自己申告
Tau2 Airline
62.6%自己申告
Finance
MMLU
92.5%自己申告
General
MMMU
84.2%自己申告
MMMU-Pro
78.4%自己申告
Internal API instruction following (hard)
64.0%自己申告
LongFact Objects
0.8%自己申告
LongFact Concepts
0.7%自己申告
Healthcare
VideoMMMU
84.6%自己申告
HealthBench Hard
1.6%自己申告
Language
COLLIE
99.0%自己申告
Long Context
OpenAI-MRCR: 2 needle 128k
95.2%自己申告
OpenAI-MRCR: 2 needle 256k
86.8%自己申告
Math
AIME 2025
94.6%自己申告
HMMT 2025
93.3%自己申告
MATH
84.7%自己申告
FrontierMath
26.3%自己申告
Humanity's Last Exam
24.8%自己申告
Multimodal
VideoMME w sub.
86.7%自己申告
CharXiv-R
81.1%自己申告
Reasoning
BrowseComp Long Context 128k
90.0%自己申告
BrowseComp Long Context 256k
88.8%自己申告
Graphwalks BFS <128k
78.3%自己申告
Graphwalks parents <128k
73.3%自己申告
ERQA
65.7%自己申告
FActScore
1.0%自己申告
AA評価指数
Math Index94.3
Intelligence Index44.6
Coding Index36.0
Math 5001.0
Aime1.0
Aime 250.9
Mmlu Pro0.9
Gpqa0.9
Tau20.8
Livecodebench0.8
Lcr0.8
Ifbench0.7
Scicode0.4
Terminalbench Hard0.3
Hle0.3
LLM Statsカテゴリスコア
Robotics20
Spatial Reasoning6
Multimodal4
Vision3
Reasoning2
Writing100
Language100
Long Context100
Video90
Biology90
Chemistry90
Code90
Finance90
Legal90
Physics90
Tool Calling80
Communication80
General80
Frontend Development70
Healthcare70
Math70
Search70
Structured Output60
Agents50
価格設定
入力価格$1.25 / 1M tokens
出力価格$10 / 1M tokens
混合価格(3:1)$3.438 / 1M tokens
速度
トークン/秒95.3 tokens/s
初トークン遅延98.86s
初回答遅延98.86s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません