GPT-5.1 (high)
OpenAIGPTProprietary
説明
The best model for coding and agentic tasks with configurable reasoning effort. GPT-5.1 is our flagship model for coding and agentic tasks with configurable reasoning and non-reasoning effort.
リリース日
2025-11-13
パラメータ
—
コンテキスト長
400K
モダリティ
file, image, text
能力レーダー
56
general
59
coding
93
reasoning
60
science推定
80
agents
90
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 14 | 84.0 | AA |
| General Ranking | 28 | 84.0 | AA |
| Math Reasoning | 17 | 95.0 | AA |
| Reasoning | 8 | 90.0 | LS |
| Science | 36 | 75.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
88.1%自己申告
Code
SWE-Bench Verified
76.3%自己申告
Communication
Tau2 Telecom
95.6%自己申告
Tau2 Retail
77.9%自己申告
Tau2 Airline
67.0%自己申告
General
MMMU
85.4%自己申告
Math
AIME 2025
94.0%自己申告
FrontierMath
26.7%自己申告
Reasoning
BrowseComp Long Context 128k
90.0%自己申告
AA評価指数
Math Index94.0
Intelligence Index47.7
Coding Index44.7
Aime 250.9
Gpqa0.9
Mmlu Pro0.9
Livecodebench0.9
Tau20.8
Lcr0.8
Ifbench0.7
Terminalbench Hard0.5
Scicode0.4
Hle0.3
LLM Statsカテゴリスコア
Vision90
Biology90
Chemistry90
General90
Healthcare90
Multimodal90
Physics90
Search90
Tool Calling80
Code80
Communication80
Frontend Development80
Reasoning80
Math60
価格設定
入力価格$1.25 / 1M tokens
出力価格$10 / 1M tokens
混合価格(3:1)$3.438 / 1M tokens
速度
トークン/秒153.0 tokens/s
初トークン遅延23.77s
初回答遅延23.77s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| OpenAI | 1.3M | 10.0M |