Passer au contenu principal

Gemini 1.5 Flash (May '24)

GoogleGemini

Description

Gemini 1.5 Flash is a fast and versatile multimodal model for scaling across diverse tasks. It supports audio, images, video, and text input, and produces text output. The model is optimized for generating code, extracting data, editing text, and more, making it ideal for narrow, high-frequency tasks.

Date de sortie
2024-05-14
Paramètres
Longueur du contexte
Modalités

Radar de capacités

21
general
19
coding
28
reasoning
22
scienceest.
25
agents
80
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement codage357
21.0
AA
Classement général410
25.0
AA
Raisonnement mathématique257
32.0
AA
Classement multimodal44
76.0
LS
Raisonnement16
87.0
LS
Science437
21.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA51.0%Aut.

Code

HumanEval74.3%Aut.

Finance

MMLU78.9%Aut.
MMLU-Pro67.3%Aut.

General

Natural2Code79.8%Aut.
MRCR71.9%Aut.
MMMU62.3%Aut.
Vibe-Eval48.9%Aut.

Healthcare

WMT2374.1%Aut.

Language

FLEURS90.4%Aut.
BIG-Bench Hard85.5%Aut.

Math

GSM8k86.2%Aut.
MGSM82.6%Aut.
MATH77.9%Aut.
MathVista65.8%Aut.
PhysicsFinals57.4%Aut.
FunctionalMATH53.6%Aut.
HiddenMath47.2%Aut.
AMC_2022_2334.8%Aut.

Multimodal

Video-MME76.1%Aut.

Reasoning

HellaSwag86.5%Aut.

Safety

XSTest97.0%Aut.

Indices d'évaluation AA

Intelligence Index
4.9
Mmlu Pro
0.6
Math 500
0.6
Gpqa
0.3
Livecodebench
0.2
Scicode
0.2
Aime
0.1
Hle
0.0

Scores par catégorie LLM Stats

Safety
100
Speech To Text
90
Language
80
Legal
70
Long Context
70
Math
70
Reasoning
70
Finance
70
General
70
Healthcare
70
Code
70
Multimodal
60
Vision
60
Physics
50
Biology
50
Chemistry
50

Tarification

Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit

Vitesse

Tokens/sec0.0
Délai du premier token0.00s
Temps de réponse0.00s

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes