GPT-4o (Aug '24)
OpenAIGPTProprietary
説明
GPT-4o ('o' for 'omni') is a multimodal AI model that accepts text, audio, image, and video inputs, and generates text, audio, and image outputs. It matches GPT-4 Turbo performance on text and code, with improvements in non-English languages, vision, and audio understanding.
リリース日
2024-08-06
パラメータ
—
コンテキスト長
128K
モダリティ
image, pdf, text
能力レーダー
8
general
32
coding
40
reasoning
36
science推定
50
agents
90
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 287 | 31.0 | AA |
| 総合ランキング | 425 | 23.0 | AA |
| 数学的推論 | 196 | 46.0 | AA |
| マルチモーダルランキング | 30 | 81.0 | LS |
| 推論 | 99 | 37.0 | LS |
| 科学 | 315 | 36.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
70.1%自己申告
Code
SWE-Bench Verified
33.2%自己申告
SWE-Lancer
32.6%自己申告
Aider-Polyglot
30.7%自己申告
Aider-Polyglot Edit
18.2%自己申告
SWE-Lancer (IC-Diamond subset)
12.4%自己申告
Communication
Tau2 Retail
63.4%自己申告
Multi-IF
60.9%自己申告
TAU-bench Retail
60.3%自己申告
Tau2 Airline
45.5%自己申告
TAU-bench Airline
42.8%自己申告
Multi-Challenge
40.3%自己申告
Tau2 Telecom
23.5%自己申告
Factuality
SimpleQA
38.2%自己申告
Finance
MMLU
85.7%自己申告
MMLU-Pro
74.7%自己申告
General
MMMLU
81.4%自己申告
IFEval
81.0%自己申告
MMMU
72.2%自己申告
MMMU-Pro
59.9%自己申告
Internal API instruction following (hard)
29.2%自己申告
Healthcare
VideoMMMU
61.2%自己申告
Image To Text
DocVQA
92.8%自己申告
Language
COLLIE
61.0%自己申告
Long Context
EgoSchema
72.2%自己申告
ComplexFuncBench
66.5%自己申告
OpenAI-MRCR: 2 needle 128k
31.9%自己申告
Math
MathVista
61.4%自己申告
AIME 2024
13.1%自己申告
Humanity's Last Exam
5.3%自己申告
Multimodal
AI2D
94.2%自己申告
ChartQA
85.7%自己申告
CharXiv-D
85.3%自己申告
CharXiv-R
58.8%自己申告
Reasoning
Graphwalks BFS <128k
41.7%自己申告
Graphwalks parents <128k
35.4%自己申告
ERQA
35.2%自己申告
Video
ActivityNet
61.9%自己申告
AA評価指数
Intelligence Index9.6
Math 5000.8
Gpqa0.5
Ifbench0.4
Lcr0.3
Scicode0.3
Livecodebench0.3
Tau20.3
Aime0.1
Terminalbench Hard0.1
Hle0.0
LLM Statsカテゴリスコア
Image To Text90
Legal80
Finance80
Instruction Following70
Language70
Multimodal70
Physics70
Healthcare70
Biology70
Chemistry70
Vision70
Long Context60
Structured Output60
General60
Writing60
Math50
Reasoning50
Communication50
Tool Calling50
Spatial Reasoning40
Factuality40
Frontend Development30
Code30
価格設定
入力価格$2.5 / 1Mトークン
出力価格$10 / 1Mトークン
混合価格(3:1)$4.375 / 1Mトークン
キャッシュ読み取り価格$1.25 / 1Mトークン
速度
トークン/秒113.3
初トークン遅延0.56s
初回答遅延0.56s
プロバイダー価格ランキング
プロバイダー価格ランキング
12 プロバイダー
最安: OpenAI最高: Venice AI
プロバイダー入力出力
1OpenAI最安
$0
$0.00001
2Azure
$0
$0.00001
3NanoGPT
$2.499
$9.996
4Abacus
$2.5
$10
5OpenRouter
$2.5
$10
6Kilo Gateway
$2.5
$10
7Cloudflare AI Gateway
$2.5
$10
8DigitalOcean
$2.5
$10
9Vercel AI Gateway
$2.5
$10
10OrcaRouter
$2.5
$10
11Merge Gateway
$2.5
$10
12Venice AI
$3.125
$12.5
このモデルの異なるAPIプロバイダー間の価格を比較。