メインコンテンツへスキップ

GPT-5.4 (low)

OpenAIGPTProprietary

説明

GPT-5.4 is OpenAI's most capable and efficient frontier model for professional work. It combines industry-leading coding capabilities with native computer-use, up to 1M tokens of context, full-resolution vision processing, tool search for large tool ecosystems, and improved reasoning across spreadsheets, presentations, and documents. It is the most token-efficient reasoning model in the GPT-5 series.

リリース日
2026-03-05
パラメータ
コンテキスト長
1.1M
モダリティ
file, image, text

能力レーダー

44
general
46
coding
87
reasoning
63
science推定
70
agents
85
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools18
68.0
LS
Code Ranking27
79.0
AA
General Ranking57
77.0
AA
Multimodal Ranking10
89.0
LS
Reasoning15
87.0
LS
Science23
80.0
AA

ベンチマークスコア (LLM Stats)

Agents

BrowseComp82.7%自己申告
Terminal-Bench 2.075.1%自己申告
OSWorld-Verified75.0%自己申告
MCP Atlas67.2%自己申告
SWE-Bench Pro57.7%自己申告
Finance Agent56.0%自己申告
Toolathlon54.6%自己申告

Biology

GPQA92.8%自己申告

Communication

Tau2 Telecom98.9%自己申告

General

MMMU-Pro81.2%自己申告

Long Context

Graphwalks parents >128k32.4%自己申告
Graphwalks BFS >128k21.4%自己申告

Math

FrontierMath47.6%自己申告
Humanity's Last Exam39.8%自己申告

Multimodal

OmniDocBench 1.589.1%自己申告

Reasoning

ARC-AGI93.7%自己申告
Graphwalks BFS <128k93.0%自己申告
Graphwalks parents <128k89.8%自己申告
ARC-AGI v273.3%自己申告

AA評価指数

Intelligence Index
47.9
Coding Index
45.6
Gpqa
0.9
Tau2
0.7
Lcr
0.7
Ifbench
0.7
Scicode
0.5
Terminalbench Hard
0.4
Hle
0.3

LLM Statsカテゴリスコア

Communication
100
Structured Output
90
Biology
90
Chemistry
90
Physics
90
Vision
80
General
80
Multimodal
80
Search
80
Spatial Reasoning
70
Tool Calling
70
Agents
70
Code
70
Reasoning
70
Finance
60
Long Context
40
Math
40
Healthcare
30

価格設定

入力価格$2.5 / 1M tokens
出力価格$15 / 1M tokens
混合価格(3:1)$5.625 / 1M tokens

速度

トークン/秒67.1 tokens/s
初トークン遅延1.85s
初回答遅延1.85s

利用可能なプロバイダー

(LS内部単位)
プロバイダー入力価格出力価格
OpenAI2.5M15.0M

外部リンク