Gemini 1.5 Pro (Sep '24)
GoogleGeminiProprietary
Description
Gemini 1.5 Pro is a mid-size multimodal model optimized for a wide range of reasoning tasks. It can process large amounts of data at once, including 2 hours of video, 19 hours of audio, codebases with 60,000 lines of code, or 2,000 pages of text.
Date de sortie
2024-09-24
Paramètres
—
Longueur du contexte
1.0M
Modalités
audio, file, image, text, video
Radar de capacités
32
general
27
coding
50
reasoning
38
scienceest.
0
agents
80
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Code Ranking | 222 | 38.0 | AA |
| General Ranking | 258 | 41.0 | AA |
| Math Reasoning | 162 | 56.0 | AA |
| Multimodal Ranking | 32 | 79.0 | LS |
| Reasoning | 4 | 93.0 | LS |
| Science | 283 | 39.0 | AA |
Scores de benchmarks (LLM Stats)
Biology
GPQA
59.1%Aut.
Code
HumanEval
84.1%Aut.
Finance
MMLU
85.9%Aut.
MMLU-Pro
75.8%Aut.
General
Natural2Code
85.4%Aut.
MRCR
82.6%Aut.
MMMU
65.9%Aut.
Vibe-Eval
53.9%Aut.
Healthcare
WMT23
75.1%Aut.
Language
BIG-Bench Hard
89.2%Aut.
FLEURS
0.07 / 100Aut.
Math
GSM8k
90.8%Aut.
MGSM
87.5%Aut.
MATH
86.5%Aut.
DROP
74.9%Aut.
MathVista
68.1%Aut.
FunctionalMATH
64.6%Aut.
PhysicsFinals
63.9%Aut.
HiddenMath
52.0%Aut.
AMC_2022_23
46.4%Aut.
Multimodal
Video-MME
78.6%Aut.
Reasoning
HellaSwag
93.3%Aut.
Safety
XSTest
98.8%Aut.
Indices d'évaluation AA
Coding Index23.6
Intelligence Index16.0
Math 5000.9
Mmlu Pro0.8
Gpqa0.6
Livecodebench0.3
Scicode0.3
Aime0.2
Hle0.0
Scores par catégorie LLM Stats
Safety100
Code80
Finance80
Healthcare80
Legal80
Long Context80
Math80
Reasoning80
Vision70
General70
Language70
Multimodal70
Biology60
Chemistry60
Physics60
Speech To Text10
Tarification
Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit
Vitesse
Tokens/sec0.0 tokens/s
Délai du premier token0.00s
Temps de réponse0.00s
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible