GPT-5.1 (high)
OpenAIGPTProprietary
描述
The best model for coding and agentic tasks with configurable reasoning effort. GPT-5.1 is our flagship model for coding and agentic tasks with configurable reasoning and non-reasoning effort.
發布日期
2025-11-13
參數規模
—
上下文長度
400K
支援模態
file, image, text
能力雷達圖
56
general
59
coding
93
reasoning
60
science估算
80
agents
90
multimodal
Science 在缺少專門科學評測時使用推理能力代理估算。
排行榜排名
基準測試分數 (LLM Stats)
Biology
GPQA
88.1%自報
Code
SWE-Bench Verified
76.3%自報
Communication
Tau2 Telecom
95.6%自報
Tau2 Retail
77.9%自報
Tau2 Airline
67.0%自報
General
MMMU
85.4%自報
Math
AIME 2025
94.0%自報
FrontierMath
26.7%自報
Reasoning
BrowseComp Long Context 128k
90.0%自報
AA 評測指數
Math Index94.0
Intelligence Index47.7
Coding Index44.7
Aime 250.9
Gpqa0.9
Mmlu Pro0.9
Livecodebench0.9
Tau20.8
Lcr0.8
Ifbench0.7
Terminalbench Hard0.5
Scicode0.4
Hle0.3
LLM Stats 分類評分
Vision90
Biology90
Chemistry90
General90
Healthcare90
Multimodal90
Physics90
Search90
Tool Calling80
Code80
Communication80
Frontend Development80
Reasoning80
Math60
定價
輸入價格$1.25 / 1M tokens
輸出價格$10 / 1M tokens
混合價格(3:1)$3.438 / 1M tokens
速度
Tokens/秒153.0 tokens/s
首Token延遲23.77s
首回答延遲23.77s
可用提供商
(LS 內部計價單位)| 提供商 | 輸入價格 | 輸出價格 |
|---|---|---|
| OpenAI | 1.3M | 10.0M |