メインコンテンツへスキップ

GPT-4.1

OpenAIGPTProprietary

説明

GPT-4.1 is OpenAI's latest and most advanced flagship model, significantly improving upon GPT-4 Turbo in performance across benchmarks, speed, and cost-effectiveness.

リリース日
2025-04-14
パラメータ
コンテキスト長
1.0M
モダリティ
file, image, text

能力レーダー

39
general
32
coding
49
reasoning
44
science推定
60
agents
85
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking177
45.0
AA
General Ranking181
52.0
AA
Math Reasoning188
48.0
AA
Multimodal Ranking53
74.0
LS
Reasoning63
60.0
LS
Science206
47.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA66.3%自己申告

Code

SWE-Bench Verified54.6%自己申告
Aider-Polyglot Edit52.9%自己申告
Aider-Polyglot51.6%自己申告

Communication

Multi-IF70.8%自己申告
TAU-bench Retail68.0%自己申告
TAU-bench Airline49.4%自己申告
Multi-Challenge38.3%自己申告

Finance

MMLU90.2%自己申告

General

IFEval87.4%自己申告
MMMLU87.3%自己申告
MMMU74.8%自己申告
Internal API instruction following (hard)49.1%自己申告

Language

COLLIE65.8%自己申告

Long Context

ComplexFuncBench65.5%自己申告
OpenAI-MRCR: 2 needle 128k57.2%自己申告
OpenAI-MRCR: 2 needle 1M46.3%自己申告
Graphwalks parents >128k25.0%自己申告
Graphwalks BFS >128k19.0%自己申告

Math

MathVista72.2%自己申告
AIME 202448.1%自己申告
AIME 202546.4%自己申告
HMMT 202528.9%自己申告
Humanity's Last Exam5.4%自己申告

Multimodal

CharXiv-D87.9%自己申告
Video-MME (long, no subtitles)72.0%自己申告
CharXiv-R56.7%自己申告

Reasoning

Graphwalks BFS <128k61.7%自己申告
Graphwalks parents <128k58.0%自己申告

AA評価指数

Math Index
34.7
Intelligence Index
26.3
Coding Index
21.8
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.7
Lcr
0.6
Tau2
0.5
Livecodebench
0.5
Aime
0.4
Ifbench
0.4
Scicode
0.4
Aime 25
0.3
Terminalbench Hard
0.1
Hle
0.0

LLM Statsカテゴリスコア

Finance
90
Legal
90
Healthcare
80
Instruction Following
80
Language
80
Structured Output
70
Writing
70
Biology
70
Chemistry
70
General
70
Multimodal
70
Physics
70
Tool Calling
60
Vision
60
Communication
60
Reasoning
60
Code
50
Frontend Development
50
Math
50
Spatial Reasoning
40
Long Context
40

価格設定

入力価格$2 / 1M tokens
出力価格$8 / 1M tokens
混合価格(3:1)$3.5 / 1M tokens

速度

トークン/秒108.1 tokens/s
初トークン遅延0.55s
初回答遅延0.55s

利用可能なプロバイダー

(LS内部単位)
プロバイダー入力価格出力価格
OpenAI2.0M8.0M

外部リンク