Gemini 1.5 Flash (May '24)

GoogleGemini

Description

Gemini 1.5 Flash is a fast and versatile multimodal model for scaling across diverse tasks. It supports audio, images, video, and text input, and produces text output. The model is optimized for generating code, extracting data, editing text, and more, making it ideal for narrow, high-frequency tasks.

Date de sortie

2024-05-14

Paramètres

—

Longueur du contexte

—

Modalités

—

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement codage	357	21.0	AA
Classement général	410	25.0	AA
Raisonnement mathématique	257	32.0	AA
Classement multimodal	44	76.0	LS
Raisonnement	16	87.0	LS
Science	437	21.0	AA

Scores de benchmarks (LLM Stats)

Biology

GPQA

51.0%Aut.

Code

HumanEval

74.3%Aut.

Finance

MMLU

78.9%Aut.

MMLU-Pro

67.3%Aut.

General

Natural2Code

79.8%Aut.

MRCR

71.9%Aut.

MMMU

62.3%Aut.

Vibe-Eval

48.9%Aut.

Healthcare

WMT23

74.1%Aut.

Language

FLEURS

90.4%Aut.

BIG-Bench Hard

85.5%Aut.

Math

GSM8k

86.2%Aut.

MGSM

82.6%Aut.

MATH

77.9%Aut.

MathVista

65.8%Aut.

PhysicsFinals

57.4%Aut.

FunctionalMATH

53.6%Aut.

HiddenMath

47.2%Aut.

AMC_2022_23

34.8%Aut.

Multimodal

Video-MME

76.1%Aut.

Reasoning

HellaSwag

86.5%Aut.

Safety

XSTest

97.0%Aut.

Indices d'évaluation AA

Intelligence Index

4.9

Mmlu Pro

0.6

Math 500

0.6

Gpqa

0.3

Livecodebench

0.2

Scicode

0.2

Aime

0.1

Hle

0.0

Scores par catégorie LLM Stats

Safety

100

Speech To Text

Language

Legal

Long Context

Math

Reasoning

Finance

General

Healthcare

Code

Multimodal

Vision

Physics

Biology

Chemistry

Tarification

Prix d'entréeGratuit

Prix de sortieGratuit

Prix mixte (3:1)Gratuit

Vitesse

Tokens/sec0.0

Délai du premier token0.00s

Temps de réponse0.00s

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes

Artificial Analysis