GPT-5 (ChatGPT)
OpenAIGPT
रिलीज़ तिथि
2025-08-07
पैरामीटर
—
संदर्भ लंबाई
400K
मोडैलिटीज़
image, text
क्षमता रडार
34
general
51
coding
52
reasoning
45
scienceअनुमानित
80
agents
90
multimodal
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| एजेंटिक क्षमता | 62 | 55.0 | LS |
| कोडिंग रैंकिंग | 161 | 54.0 | AA |
| सामान्य रैंकिंग | 290 | 37.0 | AA |
| गणितीय तर्क | 186 | 49.0 | AA |
| मल्टीमॉडल रैंकिंग | 25 | 84.0 | LS |
| तर्क | 45 | 72.0 | LS |
| विज्ञान | 217 | 47.0 | AA |
बेंचमार्क स्कोर (LLM Stats)
Agents
BrowseComp
54.9%स्वयं
Biology
GPQA
85.7%स्वयं
Code
SWE-Lancer (IC-Diamond subset)
100.0%स्वयं
HumanEval
93.4%स्वयं
Aider-Polyglot
88.0%स्वयं
SWE-Bench Verified
74.9%स्वयं
Communication
Tau2 Telecom
96.7%स्वयं
Tau2 Retail
81.1%स्वयं
Multi-Challenge
69.6%स्वयं
Tau2 Airline
62.6%स्वयं
Finance
MMLU
92.5%स्वयं
General
MMMU
84.2%स्वयं
MMMU-Pro
78.4%स्वयं
Internal API instruction following (hard)
64.0%स्वयं
LongFact Objects
0.8%स्वयं
LongFact Concepts
0.7%स्वयं
Healthcare
VideoMMMU
84.6%स्वयं
HealthBench Hard
1.6%स्वयं
Language
COLLIE
99.0%स्वयं
Long Context
OpenAI-MRCR: 2 needle 128k
95.2%स्वयं
OpenAI-MRCR: 2 needle 256k
86.8%स्वयं
Math
AIME 2025
94.6%स्वयं
HMMT 2025
93.3%स्वयं
MATH
84.7%स्वयं
FrontierMath
26.3%स्वयं
Humanity's Last Exam
24.8%स्वयं
Multimodal
VideoMME w sub.
86.7%स्वयं
CharXiv-R
81.1%स्वयं
Reasoning
BrowseComp Long Context 128k
90.0%स्वयं
BrowseComp Long Context 256k
88.8%स्वयं
Graphwalks BFS <128k
78.3%स्वयं
Graphwalks parents <128k
73.3%स्वयं
ERQA
65.7%स्वयं
FActScore
1.0%स्वयं
AA मूल्यांकन सूचकांक
Math Index48.3
Intelligence Index15.3
Mmlu Pro0.8
Gpqa0.7
Lcr0.6
Livecodebench0.5
Aime 250.5
Ifbench0.5
Scicode0.4
Terminalbench Hard0.1
Hle0.1
Tau20.0
LLM Stats श्रेणी स्कोर
Language100
Long Context100
Writing100
Legal90
Physics90
Finance90
Biology90
Chemistry90
Code90
Video90
Reasoning80
General80
Communication80
Tool Calling80
Math70
Multimodal70
Search70
Frontend Development70
Healthcare70
Vision70
Spatial Reasoning60
Structured Output60
Agents50
Robotics20
मूल्य निर्धारण
इनपुट मूल्य$1.25 / 1M टोकन
आउटपुट मूल्य$10 / 1M टोकन
मिश्रित मूल्य (3:1)$3.438 / 1M टोकन
कैश पठन मूल्य$0.125 / 1M टोकन
गति
टोकन/सेकंड193.1
पहले टोकन में देरी0.49s
पहले उत्तर में देरी0.49s
प्रदाता मूल्य रैंकिंग
प्रदाता मूल्य रैंकिंग
10 प्रदाता
सबसे सस्ता: OpenCode Zenसबसे महंगा: Neon
प्रदाताइनपुटआउटपुट
1OpenCode Zenसबसे सस्ता
$1.07
$8.5
2OpenAIप्राथमिक
$1.25
$10
3302.AI
$1.25
$10
4Abacus
$1.25
$10
5SAP AI Core
$1.25
$10
6Helicone
$1.25
$10
7Azure Cognitive Services
$1.25
$10
8LLM Gateway
$1.25
$10
9Azure
$1.25
$10
10Neon
$1.25
$10
इस मॉडल के लिए विभिन्न API प्रदाताओं के मूल्य निर्धारण की तुलना करें।