Gemini 1.5 Flash (Sep '24)
GoogleGeminiProprietary
Description
Gemini 1.5 Flash is a fast and versatile multimodal model for scaling across diverse tasks. It supports audio, images, video, and text input, and produces text output. The model is optimized for generating code, extracting data, editing text, and more, making it ideal for narrow, high-frequency tasks.
Date de sortie
2024-09-24
Paramètres
—
Longueur du contexte
—
Modalités
image, text
Radar de capacités
29
general
27
coding
43
reasoning
31
scienceest.
0
agents
80
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Code Ranking | 268 | 30.0 | AA |
| General Ranking | 316 | 35.0 | AA |
| Math Reasoning | 180 | 51.0 | AA |
| Multimodal Ranking | 39 | 76.0 | LS |
| Reasoning | 16 | 87.0 | LS |
| Science | 350 | 31.0 | AA |
Scores de benchmarks (LLM Stats)
Biology
GPQA
51.0%Aut.
Code
HumanEval
74.3%Aut.
Finance
MMLU
78.9%Aut.
MMLU-Pro
67.3%Aut.
General
Natural2Code
79.8%Aut.
MRCR
71.9%Aut.
MMMU
62.3%Aut.
Vibe-Eval
48.9%Aut.
Healthcare
WMT23
74.1%Aut.
Language
BIG-Bench Hard
85.5%Aut.
FLEURS
0.10 / 100Aut.
Math
GSM8k
86.2%Aut.
MGSM
82.6%Aut.
MATH
77.9%Aut.
MathVista
65.8%Aut.
PhysicsFinals
57.4%Aut.
FunctionalMATH
53.6%Aut.
HiddenMath
47.2%Aut.
AMC_2022_23
34.8%Aut.
Multimodal
Video-MME
76.1%Aut.
Reasoning
HellaSwag
86.5%Aut.
Safety
XSTest
97.0%Aut.
Indices d'évaluation AA
Intelligence Index13.8
Math 5000.8
Mmlu Pro0.7
Gpqa0.5
Livecodebench0.3
Scicode0.3
Aime0.2
Hle0.0
Scores par catégorie LLM Stats
Safety100
Code70
Finance70
General70
Healthcare70
Legal70
Long Context70
Math70
Reasoning70
Vision60
Language60
Multimodal60
Biology50
Chemistry50
Physics50
Speech To Text10
Tarification
Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit
Vitesse
Tokens/sec0.0 tokens/s
Délai du premier token0.00s
Temps de réponse0.00s
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible