Gemini 1.5 Pro (Sep '24)
GoogleGeminiProprietary
説明
Gemini 1.5 Pro is a mid-size multimodal model optimized for a wide range of reasoning tasks. It can process large amounts of data at once, including 2 hours of video, 19 hours of audio, codebases with 60,000 lines of code, or 2,000 pages of text.
リリース日
2024-09-24
パラメータ
—
コンテキスト長
1.0M
モダリティ
audio, file, image, text, video
能力レーダー
32
general
27
coding
50
reasoning
38
science推定
0
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 222 | 38.0 | AA |
| General Ranking | 258 | 41.0 | AA |
| Math Reasoning | 162 | 56.0 | AA |
| Multimodal Ranking | 32 | 79.0 | LS |
| Reasoning | 4 | 93.0 | LS |
| Science | 283 | 39.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
59.1%自己申告
Code
HumanEval
84.1%自己申告
Finance
MMLU
85.9%自己申告
MMLU-Pro
75.8%自己申告
General
Natural2Code
85.4%自己申告
MRCR
82.6%自己申告
MMMU
65.9%自己申告
Vibe-Eval
53.9%自己申告
Healthcare
WMT23
75.1%自己申告
Language
BIG-Bench Hard
89.2%自己申告
FLEURS
0.07 / 100自己申告
Math
GSM8k
90.8%自己申告
MGSM
87.5%自己申告
MATH
86.5%自己申告
DROP
74.9%自己申告
MathVista
68.1%自己申告
FunctionalMATH
64.6%自己申告
PhysicsFinals
63.9%自己申告
HiddenMath
52.0%自己申告
AMC_2022_23
46.4%自己申告
Multimodal
Video-MME
78.6%自己申告
Reasoning
HellaSwag
93.3%自己申告
Safety
XSTest
98.8%自己申告
AA評価指数
Coding Index23.6
Intelligence Index16.0
Math 5000.9
Mmlu Pro0.8
Gpqa0.6
Livecodebench0.3
Scicode0.3
Aime0.2
Hle0.0
LLM Statsカテゴリスコア
Safety100
Code80
Finance80
Healthcare80
Legal80
Long Context80
Math80
Reasoning80
Vision70
General70
Language70
Multimodal70
Biology60
Chemistry60
Physics60
Speech To Text10
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
速度
トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません