GPT-4.1
OpenAIGPTProprietary
説明
GPT-4.1 is OpenAI's latest and most advanced flagship model, significantly improving upon GPT-4 Turbo in performance across benchmarks, speed, and cost-effectiveness.
リリース日
2025-04-14
パラメータ
—
コンテキスト長
1.0M
モダリティ
file, image, text
能力レーダー
39
general
32
coding
49
reasoning
44
science推定
60
agents
85
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 177 | 45.0 | AA |
| General Ranking | 181 | 52.0 | AA |
| Math Reasoning | 188 | 48.0 | AA |
| Multimodal Ranking | 53 | 74.0 | LS |
| Reasoning | 63 | 60.0 | LS |
| Science | 206 | 47.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
66.3%自己申告
Code
SWE-Bench Verified
54.6%自己申告
Aider-Polyglot Edit
52.9%自己申告
Aider-Polyglot
51.6%自己申告
Communication
Multi-IF
70.8%自己申告
TAU-bench Retail
68.0%自己申告
TAU-bench Airline
49.4%自己申告
Multi-Challenge
38.3%自己申告
Finance
MMLU
90.2%自己申告
General
IFEval
87.4%自己申告
MMMLU
87.3%自己申告
MMMU
74.8%自己申告
Internal API instruction following (hard)
49.1%自己申告
Language
COLLIE
65.8%自己申告
Long Context
ComplexFuncBench
65.5%自己申告
OpenAI-MRCR: 2 needle 128k
57.2%自己申告
OpenAI-MRCR: 2 needle 1M
46.3%自己申告
Graphwalks parents >128k
25.0%自己申告
Graphwalks BFS >128k
19.0%自己申告
Math
MathVista
72.2%自己申告
AIME 2024
48.1%自己申告
AIME 2025
46.4%自己申告
HMMT 2025
28.9%自己申告
Humanity's Last Exam
5.4%自己申告
Multimodal
CharXiv-D
87.9%自己申告
Video-MME (long, no subtitles)
72.0%自己申告
CharXiv-R
56.7%自己申告
Reasoning
Graphwalks BFS <128k
61.7%自己申告
Graphwalks parents <128k
58.0%自己申告
AA評価指数
Math Index34.7
Intelligence Index26.3
Coding Index21.8
Math 5000.9
Mmlu Pro0.8
Gpqa0.7
Lcr0.6
Tau20.5
Livecodebench0.5
Aime0.4
Ifbench0.4
Scicode0.4
Aime 250.3
Terminalbench Hard0.1
Hle0.0
LLM Statsカテゴリスコア
Finance90
Legal90
Healthcare80
Instruction Following80
Language80
Structured Output70
Writing70
Biology70
Chemistry70
General70
Multimodal70
Physics70
Tool Calling60
Vision60
Communication60
Reasoning60
Code50
Frontend Development50
Math50
Spatial Reasoning40
Long Context40
価格設定
入力価格$2 / 1M tokens
出力価格$8 / 1M tokens
混合価格(3:1)$3.5 / 1M tokens
速度
トークン/秒108.1 tokens/s
初トークン遅延0.55s
初回答遅延0.55s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| OpenAI | 2.0M | 8.0M |