GPT-4.5 (Preview)
OpenAIGPTProprietary
विवरण
GPT-4.5 is OpenAI's most advanced model, offering improved reasoning, coding, and creative capabilities with faster performance and longer context handling than GPT-4. It features enhanced instruction following, reduced hallucinations, and better factual accuracy.
रिलीज़ तिथि
2025-02-27
पैरामीटर
—
संदर्भ लंबाई
—
मोडैलिटीज़
image, text
क्षमता रडार
14
general
50
coding
80
reasoning
60
scienceअनुमानित
60
agents
70
multimodal
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| सामान्य रैंकिंग | 444 | 21.0 | AA |
| मल्टीमॉडल रैंकिंग | 52 | 75.0 | LS |
| तर्क | 43 | 73.0 | LS |
बेंचमार्क स्कोर (LLM Stats)
Biology
GPQA
69.5%स्वयं
Code
HumanEval
88.0%स्वयं
Aider-Polyglot Edit
44.9%स्वयं
SWE-Bench Verified
38.0%स्वयं
SWE-Lancer
37.3%स्वयं
SWE-Lancer (IC-Diamond subset)
17.4%स्वयं
Communication
Multi-IF
70.8%स्वयं
TAU-bench Retail
68.4%स्वयं
TAU-bench Airline
50.0%स्वयं
Multi-Challenge
43.8%स्वयं
Factuality
SimpleQA
62.5%स्वयं
Finance
MMLU
90.8%स्वयं
General
IFEval
88.2%स्वयं
MMMLU
85.1%स्वयं
MMMU
75.2%स्वयं
Internal API instruction following (hard)
54.0%स्वयं
Language
COLLIE
72.3%स्वयं
Long Context
ComplexFuncBench
63.0%स्वयं
OpenAI-MRCR: 2 needle 128k
38.5%स्वयं
Math
GSM8k
97.0%स्वयं
MathVista
72.3%स्वयं
AIME 2024
36.7%स्वयं
Multimodal
CharXiv-D
90.0%स्वयं
CharXiv-R
55.4%स्वयं
Reasoning
Graphwalks parents <128k
72.6%स्वयं
Graphwalks BFS <128k
72.3%स्वयं
AA मूल्यांकन सूचकांक
Intelligence Index13.6
LLM Stats श्रेणी स्कोर
Legal90
Finance90
Instruction Following80
Language80
Math80
Healthcare80
Multimodal70
Physics70
Spatial Reasoning70
Structured Output70
General70
Biology70
Chemistry70
Vision70
Writing70
Reasoning60
Factuality60
Communication60
Tool Calling60
Long Context50
Code50
Frontend Development40
मूल्य निर्धारण
इनपुट मूल्यमुफ्त
आउटपुट मूल्यमुफ्त
मिश्रित मूल्य (3:1)मुफ्त
गति
टोकन/सेकंड0.0
पहले टोकन में देरी0.00s
पहले उत्तर में देरी0.00s
प्रदाता मूल्य रैंकिंग
कोई प्रदाता डेटा उपलब्ध नहीं