GPT-4o (March 2025, chatgpt-4o-latest)
OpenAIGPT
リリース日
2025-03-27
パラメータ
—
コンテキスト長
400K
モダリティ
image, text
能力レーダー
32
general
41
coding
41
reasoning
43
science推定
80
agents
90
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| エージェント能力 | 62 | 55.0 | LS |
| コーディングランキング | 192 | 46.0 | AA |
| 総合ランキング | 251 | 42.0 | AA |
| 数学的推論 | 221 | 40.0 | AA |
| マルチモーダルランキング | 25 | 84.0 | LS |
| 推論 | 45 | 72.0 | LS |
| 科学 | 242 | 45.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
BrowseComp
54.9%自己申告
Biology
GPQA
85.7%自己申告
Code
SWE-Lancer (IC-Diamond subset)
100.0%自己申告
HumanEval
93.4%自己申告
Aider-Polyglot
88.0%自己申告
SWE-Bench Verified
74.9%自己申告
Communication
Tau2 Telecom
96.7%自己申告
Tau2 Retail
81.1%自己申告
Multi-Challenge
69.6%自己申告
Tau2 Airline
62.6%自己申告
Finance
MMLU
92.5%自己申告
General
MMMU
84.2%自己申告
MMMU-Pro
78.4%自己申告
Internal API instruction following (hard)
64.0%自己申告
LongFact Objects
0.8%自己申告
LongFact Concepts
0.7%自己申告
Healthcare
VideoMMMU
84.6%自己申告
HealthBench Hard
1.6%自己申告
Language
COLLIE
99.0%自己申告
Long Context
OpenAI-MRCR: 2 needle 128k
95.2%自己申告
OpenAI-MRCR: 2 needle 256k
86.8%自己申告
Math
AIME 2025
94.6%自己申告
HMMT 2025
93.3%自己申告
MATH
84.7%自己申告
FrontierMath
26.3%自己申告
Humanity's Last Exam
24.8%自己申告
Multimodal
VideoMME w sub.
86.7%自己申告
CharXiv-R
81.1%自己申告
Reasoning
BrowseComp Long Context 128k
90.0%自己申告
BrowseComp Long Context 256k
88.8%自己申告
Graphwalks BFS <128k
78.3%自己申告
Graphwalks parents <128k
73.3%自己申告
ERQA
65.7%自己申告
FActScore
1.0%自己申告
AA評価指数
Math Index25.7
Intelligence Index12.3
Math 5000.9
Mmlu Pro0.8
Gpqa0.7
Livecodebench0.4
Scicode0.4
Aime0.3
Aime 250.3
Hle0.1
LLM Statsカテゴリスコア
Language100
Long Context100
Writing100
Legal90
Physics90
Finance90
Biology90
Chemistry90
Code90
Video90
Reasoning80
General80
Communication80
Tool Calling80
Search70
Math70
Multimodal70
Frontend Development70
Healthcare70
Vision70
Spatial Reasoning60
Structured Output60
Agents50
Robotics20
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
キャッシュ読み取り価格$0.125 / 1Mトークン
速度
トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s
プロバイダー価格ランキング
プロバイダー価格ランキング
10 プロバイダー
最安: OpenCode Zen最高: Neon
プロバイダー入力出力
1OpenCode Zen最安
$1.07
$8.5
2302.AI
$1.25
$10
3Abacus
$1.25
$10
4SAP AI Core
$1.25
$10
5Helicone
$1.25
$10
6Azure Cognitive Services
$1.25
$10
7OpenAI
$1.25
$10
8LLM Gateway
$1.25
$10
9Azure
$1.25
$10
10Neon
$1.25
$10
このモデルの異なるAPIプロバイダー間の価格を比較。