Gemini 1.5 Flash (May '24)
GoogleGemini
Description
Gemini 1.5 Flash is a fast and versatile multimodal model for scaling across diverse tasks. It supports audio, images, video, and text input, and produces text output. The model is optimized for generating code, extracting data, editing text, and more, making it ideal for narrow, high-frequency tasks.
Date de sortie
2024-05-14
Paramètres
—
Longueur du contexte
—
Modalités
—
Radar de capacités
21
general
19
coding
28
reasoning
22
scienceest.
25
agents
80
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Classement codage | 357 | 21.0 | AA |
| Classement général | 410 | 25.0 | AA |
| Raisonnement mathématique | 257 | 32.0 | AA |
| Classement multimodal | 44 | 76.0 | LS |
| Raisonnement | 16 | 87.0 | LS |
| Science | 437 | 21.0 | AA |
Scores de benchmarks (LLM Stats)
Biology
GPQA
51.0%Aut.
Code
HumanEval
74.3%Aut.
Finance
MMLU
78.9%Aut.
MMLU-Pro
67.3%Aut.
General
Natural2Code
79.8%Aut.
MRCR
71.9%Aut.
MMMU
62.3%Aut.
Vibe-Eval
48.9%Aut.
Healthcare
WMT23
74.1%Aut.
Language
FLEURS
90.4%Aut.
BIG-Bench Hard
85.5%Aut.
Math
GSM8k
86.2%Aut.
MGSM
82.6%Aut.
MATH
77.9%Aut.
MathVista
65.8%Aut.
PhysicsFinals
57.4%Aut.
FunctionalMATH
53.6%Aut.
HiddenMath
47.2%Aut.
AMC_2022_23
34.8%Aut.
Multimodal
Video-MME
76.1%Aut.
Reasoning
HellaSwag
86.5%Aut.
Safety
XSTest
97.0%Aut.
Indices d'évaluation AA
Intelligence Index4.9
Mmlu Pro0.6
Math 5000.6
Gpqa0.3
Livecodebench0.2
Scicode0.2
Aime0.1
Hle0.0
Scores par catégorie LLM Stats
Safety100
Speech To Text90
Language80
Legal70
Long Context70
Math70
Reasoning70
Finance70
General70
Healthcare70
Code70
Multimodal60
Vision60
Physics50
Biology50
Chemistry50
Tarification
Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit
Vitesse
Tokens/sec0.0
Délai du premier token0.00s
Temps de réponse0.00s
Classement des Prix par Fournisseur
Aucune donnée de fournisseur disponible