Passer au contenu principal

Gemini 1.5 Flash (Sep '24)

GoogleGeminiProprietary

Description

Gemini 1.5 Flash is a fast and versatile multimodal model for scaling across diverse tasks. It supports audio, images, video, and text input, and produces text output. The model is optimized for generating code, extracting data, editing text, and more, making it ideal for narrow, high-frequency tasks.

Date de sortie
2024-09-24
Paramètres
Longueur du contexte
Modalités
image, text

Radar de capacités

29
general
27
coding
43
reasoning
31
scienceest.
0
agents
80
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Code Ranking268
30.0
AA
General Ranking316
35.0
AA
Math Reasoning180
51.0
AA
Multimodal Ranking39
76.0
LS
Reasoning16
87.0
LS
Science350
31.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA51.0%Aut.

Code

HumanEval74.3%Aut.

Finance

MMLU78.9%Aut.
MMLU-Pro67.3%Aut.

General

Natural2Code79.8%Aut.
MRCR71.9%Aut.
MMMU62.3%Aut.
Vibe-Eval48.9%Aut.

Healthcare

WMT2374.1%Aut.

Language

BIG-Bench Hard85.5%Aut.
FLEURS0.10 / 100Aut.

Math

GSM8k86.2%Aut.
MGSM82.6%Aut.
MATH77.9%Aut.
MathVista65.8%Aut.
PhysicsFinals57.4%Aut.
FunctionalMATH53.6%Aut.
HiddenMath47.2%Aut.
AMC_2022_2334.8%Aut.

Multimodal

Video-MME76.1%Aut.

Reasoning

HellaSwag86.5%Aut.

Safety

XSTest97.0%Aut.

Indices d'évaluation AA

Intelligence Index
13.8
Math 500
0.8
Mmlu Pro
0.7
Gpqa
0.5
Livecodebench
0.3
Scicode
0.3
Aime
0.2
Hle
0.0

Scores par catégorie LLM Stats

Safety
100
Code
70
Finance
70
General
70
Healthcare
70
Legal
70
Long Context
70
Math
70
Reasoning
70
Vision
60
Language
60
Multimodal
60
Biology
50
Chemistry
50
Physics
50
Speech To Text
10

Tarification

Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit

Vitesse

Tokens/sec0.0 tokens/s
Délai du premier token0.00s
Temps de réponse0.00s

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes