GPT-4.5 (Preview)
OpenAIGPTProprietary
説明
GPT-4.5 is OpenAI's most advanced model, offering improved reasoning, coding, and creative capabilities with faster performance and longer context handling than GPT-4. It features enhanced instruction following, reduced hallucinations, and better factual accuracy.
リリース日
2025-02-27
パラメータ
—
コンテキスト長
—
モダリティ
image, text
能力レーダー
20
general
50
coding
80
reasoning
60
science推定
60
agents
70
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| General Ranking | 378 | 28.0 | AA |
| Multimodal Ranking | 47 | 75.0 | LS |
| Reasoning | 40 | 73.0 | LS |
ベンチマークスコア (LLM Stats)
Biology
GPQA
69.5%自己申告
Code
HumanEval
88.0%自己申告
Aider-Polyglot Edit
44.9%自己申告
SWE-Bench Verified
38.0%自己申告
SWE-Lancer
37.3%自己申告
SWE-Lancer (IC-Diamond subset)
17.4%自己申告
Communication
Multi-IF
70.8%自己申告
TAU-bench Retail
68.4%自己申告
TAU-bench Airline
50.0%自己申告
Multi-Challenge
43.8%自己申告
Factuality
SimpleQA
62.5%自己申告
Finance
MMLU
90.8%自己申告
General
IFEval
88.2%自己申告
MMMLU
85.1%自己申告
MMMU
75.2%自己申告
Internal API instruction following (hard)
54.0%自己申告
Language
COLLIE
72.3%自己申告
Long Context
ComplexFuncBench
63.0%自己申告
OpenAI-MRCR: 2 needle 128k
38.5%自己申告
Math
GSM8k
97.0%自己申告
MathVista
72.3%自己申告
AIME 2024
36.7%自己申告
Multimodal
CharXiv-D
90.0%自己申告
CharXiv-R
55.4%自己申告
Reasoning
Graphwalks parents <128k
72.6%自己申告
Graphwalks BFS <128k
72.3%自己申告
AA評価指数
Intelligence Index20.0
LLM Statsカテゴリスコア
Finance90
Legal90
Healthcare80
Instruction Following80
Language80
Math80
Spatial Reasoning70
Structured Output70
Vision70
Writing70
Biology70
Chemistry70
General70
Multimodal70
Physics70
Tool Calling60
Communication60
Factuality60
Reasoning60
Code50
Long Context50
Frontend Development40
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
速度
トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません