GPT-4o (Aug '24)
OpenAIGPTProprietary
説明
GPT-4o ('o' for 'omni') is a multimodal AI model that accepts text, audio, image, and video inputs, and generates text, audio, and image outputs. It matches GPT-4 Turbo performance on text and code, with improvements in non-English languages, vision, and audio understanding.
リリース日
2024-08-06
パラメータ
—
コンテキスト長
128K
モダリティ
file, image, text
能力レーダー
15
general
24
coding
40
reasoning
36
science推定
50
agents
90
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 265 | 30.0 | AA |
| General Ranking | 377 | 28.0 | AA |
| Math Reasoning | 196 | 46.0 | AA |
| Multimodal Ranking | 27 | 81.0 | LS |
| Reasoning | 94 | 37.0 | LS |
| Science | 290 | 37.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
70.1%自己申告
Code
SWE-Bench Verified
33.2%自己申告
SWE-Lancer
32.6%自己申告
Aider-Polyglot
30.7%自己申告
Aider-Polyglot Edit
18.2%自己申告
SWE-Lancer (IC-Diamond subset)
12.4%自己申告
Communication
Tau2 Retail
63.4%自己申告
Multi-IF
60.9%自己申告
TAU-bench Retail
60.3%自己申告
Tau2 Airline
45.5%自己申告
TAU-bench Airline
42.8%自己申告
Multi-Challenge
40.3%自己申告
Tau2 Telecom
23.5%自己申告
Factuality
SimpleQA
38.2%自己申告
Finance
MMLU
85.7%自己申告
MMLU-Pro
74.7%自己申告
General
MMMLU
81.4%自己申告
IFEval
81.0%自己申告
MMMU
72.2%自己申告
MMMU-Pro
59.9%自己申告
Internal API instruction following (hard)
29.2%自己申告
Healthcare
VideoMMMU
61.2%自己申告
Image To Text
DocVQA
92.8%自己申告
Language
COLLIE
61.0%自己申告
Long Context
EgoSchema
72.2%自己申告
ComplexFuncBench
66.5%自己申告
OpenAI-MRCR: 2 needle 128k
31.9%自己申告
Math
MathVista
61.4%自己申告
AIME 2024
13.1%自己申告
Humanity's Last Exam
5.3%自己申告
Multimodal
AI2D
94.2%自己申告
ChartQA
85.7%自己申告
CharXiv-D
85.3%自己申告
CharXiv-R
58.8%自己申告
Reasoning
Graphwalks BFS <128k
41.7%自己申告
Graphwalks parents <128k
35.4%自己申告
ERQA
35.2%自己申告
Video
ActivityNet
61.9%自己申告
AA評価指数
Intelligence Index18.6
Coding Index16.6
Math 5000.8
Gpqa0.5
Ifbench0.4
Lcr0.3
Scicode0.3
Livecodebench0.3
Tau20.3
Aime0.1
Terminalbench Hard0.1
Hle0.0
LLM Statsカテゴリスコア
Image To Text90
Finance80
Legal80
Vision70
Biology70
Chemistry70
Healthcare70
Instruction Following70
Language70
Multimodal70
Physics70
Structured Output60
Writing60
General60
Long Context60
Tool Calling50
Communication50
Math50
Reasoning50
Spatial Reasoning40
Factuality40
Code30
Frontend Development30
価格設定
入力価格$2.5 / 1M tokens
出力価格$10 / 1M tokens
混合価格(3:1)$4.375 / 1M tokens
速度
トークン/秒102.1 tokens/s
初トークン遅延0.65s
初回答遅延0.65s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| OpenAI | 2.5M | 10.0M |
| Azure | 2.5M | 10.0M |