跳轉到主要內容

GPT-5.1 (high)

OpenAIGPTProprietary

描述

The best model for coding and agentic tasks with configurable reasoning effort. GPT-5.1 is our flagship model for coding and agentic tasks with configurable reasoning and non-reasoning effort.

發布日期
2025-11-13
參數規模
上下文長度
400K
支援模態
file, image, text

能力雷達圖

56
general
59
coding
93
reasoning
60
science估算
80
agents
90
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域#排名分數來源
代码能力榜14
84.0
AA
通用能力榜28
84.0
AA
数学推理17
95.0
AA
推理能力8
90.0
LS
科学能力36
75.0
AA

基準測試分數 (LLM Stats)

Biology

GPQA88.1%自報

Code

SWE-Bench Verified76.3%自報

Communication

Tau2 Telecom95.6%自報
Tau2 Retail77.9%自報
Tau2 Airline67.0%自報

General

MMMU85.4%自報

Math

AIME 202594.0%自報
FrontierMath26.7%自報

Reasoning

BrowseComp Long Context 128k90.0%自報

AA 評測指數

Math Index
94.0
Intelligence Index
47.7
Coding Index
44.7
Aime 25
0.9
Gpqa
0.9
Mmlu Pro
0.9
Livecodebench
0.9
Tau2
0.8
Lcr
0.8
Ifbench
0.7
Terminalbench Hard
0.5
Scicode
0.4
Hle
0.3

LLM Stats 分類評分

Vision
90
Biology
90
Chemistry
90
General
90
Healthcare
90
Multimodal
90
Physics
90
Search
90
Tool Calling
80
Code
80
Communication
80
Frontend Development
80
Reasoning
80
Math
60

定價

輸入價格$1.25 / 1M tokens
輸出價格$10 / 1M tokens
混合價格(3:1)$3.438 / 1M tokens

速度

Tokens/秒153.0 tokens/s
首Token延遲23.77s
首回答延遲23.77s

可用提供商

(LS 內部計價單位)
提供商輸入價格輸出價格
OpenAI1.3M10.0M

外部連結