跳转到主要内容

GPT-5.1 (high)

OpenAIGPTProprietary

描述

The best model for coding and agentic tasks with configurable reasoning effort. GPT-5.1 is our flagship model for coding and agentic tasks with configurable reasoning and non-reasoning effort.

发布日期
2025-11-13
参数规模
上下文长度
400K
支持模态
file, image, text

能力雷达图

56
general
59
coding
93
reasoning
60
science估算
80
agents
90
multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域#排名分数来源
代码能力榜14
84.0
AA
通用能力榜28
84.0
AA
数学推理17
95.0
AA
推理能力8
90.0
LS
科学能力36
75.0
AA

基准测试分数 (LLM Stats)

Biology

GPQA88.1%自报

Code

SWE-Bench Verified76.3%自报

Communication

Tau2 Telecom95.6%自报
Tau2 Retail77.9%自报
Tau2 Airline67.0%自报

General

MMMU85.4%自报

Math

AIME 202594.0%自报
FrontierMath26.7%自报

Reasoning

BrowseComp Long Context 128k90.0%自报

AA 评测指数

Math Index
94.0
Intelligence Index
47.7
Coding Index
44.7
Aime 25
0.9
Gpqa
0.9
Mmlu Pro
0.9
Livecodebench
0.9
Tau2
0.8
Lcr
0.8
Ifbench
0.7
Terminalbench Hard
0.5
Scicode
0.4
Hle
0.3

LLM Stats 分类评分

Vision
90
Biology
90
Chemistry
90
General
90
Healthcare
90
Multimodal
90
Physics
90
Search
90
Tool Calling
80
Code
80
Communication
80
Frontend Development
80
Reasoning
80
Math
60

定价

输入价格$1.25 / 1M tokens
输出价格$10 / 1M tokens
混合价格(3:1)$3.438 / 1M tokens

速度

Tokens/秒153.0 tokens/s
首Token延迟23.77s
首回答延迟23.77s

可用提供商

(LS 内部计价单位)
提供商输入价格输出价格
OpenAI1.3M10.0M

外部链接