GPT-5.1 (high)
OpenAIGPTProprietary
描述
The best model for coding and agentic tasks with configurable reasoning effort. GPT-5.1 is our flagship model for coding and agentic tasks with configurable reasoning and non-reasoning effort.
发布日期
2025-11-13
参数规模
—
上下文长度
400K
支持模态
file, image, text
能力雷达图
56
general
59
coding
93
reasoning
60
science估算
80
agents
90
multimodal
Science 在缺少专门科学评测时使用推理能力代理估算。
排行榜排名
基准测试分数 (LLM Stats)
Biology
GPQA
88.1%自报
Code
SWE-Bench Verified
76.3%自报
Communication
Tau2 Telecom
95.6%自报
Tau2 Retail
77.9%自报
Tau2 Airline
67.0%自报
General
MMMU
85.4%自报
Math
AIME 2025
94.0%自报
FrontierMath
26.7%自报
Reasoning
BrowseComp Long Context 128k
90.0%自报
AA 评测指数
Math Index94.0
Intelligence Index47.7
Coding Index44.7
Aime 250.9
Gpqa0.9
Mmlu Pro0.9
Livecodebench0.9
Tau20.8
Lcr0.8
Ifbench0.7
Terminalbench Hard0.5
Scicode0.4
Hle0.3
LLM Stats 分类评分
Vision90
Biology90
Chemistry90
General90
Healthcare90
Multimodal90
Physics90
Search90
Tool Calling80
Code80
Communication80
Frontend Development80
Reasoning80
Math60
定价
输入价格$1.25 / 1M tokens
输出价格$10 / 1M tokens
混合价格(3:1)$3.438 / 1M tokens
速度
Tokens/秒153.0 tokens/s
首Token延迟23.77s
首回答延迟23.77s
可用提供商
(LS 内部计价单位)| 提供商 | 输入价格 | 输出价格 |
|---|---|---|
| OpenAI | 1.3M | 10.0M |