GPT-4o (May '24)
OpenAIGPTProprietary
描述
GPT-4o ('o' for 'omni') is a multimodal AI model that accepts text, audio, image, and video inputs, and generates text, audio, and image outputs. It matches GPT-4 Turbo performance on text and code, with improvements in non-English languages, vision, and audio understanding.
发布日期
2024-05-13
参数规模
—
上下文长度
128K
支持模态
file, image, text
能力雷达图
31
general
28
coding
40
reasoning
35
science估算
0
agents
85
multimodal
Science 在缺少专门科学评测时使用推理能力代理估算。
排行榜排名
基准测试分数 (LLM Stats)
Biology
GPQA
53.6%自报
Code
HumanEval
90.2%自报
Finance
MMLU
88.7%自报
MMLU-Pro
72.6%自报
Math
MGSM
90.5%自报
DROP
83.4%自报
MATH
76.6%自报
MathVista
63.8%自报
AA 评测指数
Coding Index24.2
Intelligence Index14.5
Math 5000.8
Mmlu Pro0.7
Gpqa0.5
Livecodebench0.3
Scicode0.3
Aime0.1
Hle0.0
LLM Stats 分类评分
Code90
Finance80
Healthcare80
Language80
Legal80
Math80
Reasoning80
General70
Vision60
Multimodal60
Biology50
Chemistry50
Physics50
定价
输入价格$5 / 1M tokens
输出价格$15 / 1M tokens
混合价格(3:1)$7.5 / 1M tokens
速度
Tokens/秒102.9 tokens/s
首Token延迟0.67s
首回答延迟0.67s
可用提供商
(LS 内部计价单位)| 提供商 | 输入价格 | 输出价格 |
|---|---|---|
| OpenAI | 2.5M | 10.0M |
| Azure | 2.5M | 10.0M |