GPT-4o (Aug '24)

OpenAIGPTProprietary

説明

GPT-4o ('o' for 'omni') is a multimodal AI model that accepts text, audio, image, and video inputs, and generates text, audio, and image outputs. It matches GPT-4 Turbo performance on text and code, with improvements in non-English languages, vision, and audio understanding.

リリース日

2024-08-06

パラメータ

—

コンテキスト長

128K

モダリティ

image, pdf, text

能力レーダー

general

coding

reasoning

science推定

agents

multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ベンチマークスコア (LLM Stats)

Biology

GPQA

70.1%自己申告

Code

SWE-Bench Verified

33.2%自己申告

SWE-Lancer

32.6%自己申告

Aider-Polyglot

30.7%自己申告

Aider-Polyglot Edit

18.2%自己申告

SWE-Lancer (IC-Diamond subset)

12.4%自己申告

Communication

Tau2 Retail

63.4%自己申告

Multi-IF

60.9%自己申告

TAU-bench Retail

60.3%自己申告

Tau2 Airline

45.5%自己申告

TAU-bench Airline

42.8%自己申告

Multi-Challenge

40.3%自己申告

Tau2 Telecom

23.5%自己申告

Factuality

SimpleQA

38.2%自己申告

Finance

MMLU

85.7%自己申告

MMLU-Pro

74.7%自己申告

General

MMMLU

81.4%自己申告

IFEval

81.0%自己申告

MMMU

72.2%自己申告

MMMU-Pro

59.9%自己申告

Internal API instruction following (hard)

29.2%自己申告

Healthcare

VideoMMMU

61.2%自己申告

Image To Text

DocVQA

92.8%自己申告

Language

COLLIE

61.0%自己申告

Long Context

EgoSchema

72.2%自己申告

ComplexFuncBench

66.5%自己申告

OpenAI-MRCR: 2 needle 128k

31.9%自己申告

Math

MathVista

61.4%自己申告

AIME 2024

13.1%自己申告

Humanity's Last Exam

5.3%自己申告

Multimodal

AI2D

94.2%自己申告

ChartQA

85.7%自己申告

CharXiv-D

85.3%自己申告

CharXiv-R

58.8%自己申告

Reasoning

Graphwalks BFS <128k

41.7%自己申告

Graphwalks parents <128k

35.4%自己申告

ERQA

35.2%自己申告

Video

ActivityNet

61.9%自己申告

AA評価指数

Intelligence Index

9.6

Math 500

0.8

Gpqa

0.5

Ifbench

0.4

Lcr

0.3

Scicode

0.3

Livecodebench

0.3

Tau2

0.3

Aime

0.1

Terminalbench Hard

0.1

Hle

0.0

LLM Statsカテゴリスコア

Image To Text

Legal

Finance

Instruction Following

Language

Multimodal

Physics

Healthcare

Biology

Chemistry

Vision

Long Context

Structured Output

General

Writing

Math

Reasoning

Communication

Tool Calling

Spatial Reasoning

Factuality

Frontend Development

Code

価格設定

入力価格$2.5 / 1Mトークン

出力価格$10 / 1Mトークン

混合価格（3:1）$4.375 / 1Mトークン

キャッシュ読み取り価格$1.25 / 1Mトークン

速度

トークン/秒113.3

初トークン遅延0.56s

初回答遅延0.56s

プロバイダー価格ランキング

12 プロバイダー

最安: OpenAI最高: Venice AI

プロバイダー入力出力

1OpenAI最安

$0.00001

2Azure

$0.00001

3NanoGPT

$2.499

$9.996

4Abacus

$2.5

$10

5OpenRouter

$2.5

$10

6Kilo Gateway

$2.5

$10

7Cloudflare AI Gateway

$2.5

$10

8DigitalOcean

$2.5

$10

9Vercel AI Gateway

$2.5

$10

10OrcaRouter

$2.5

$10

11Merge Gateway

$2.5

$10

12Venice AI

$3.125

$12.5

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク

LLM Stats Artificial Analysis

ドメイン	#順位	スコア	ソース
コーディングランキング	287	31.0	AA
総合ランキング	425	23.0	AA
数学的推論	196	46.0	AA
マルチモーダルランキング	30	81.0	LS
推論	99	37.0	LS
科学	315	36.0	AA