Passer au contenu principal

Gemini 2.0 Flash (Feb '25)

GoogleGeminiProprietary

Description

Next-generation model featuring superior speed, native tool use, multimodal generation, and a 1M token context window. Supports audio, images, video, and text input with capabilities for structured outputs, function calling, code execution, search, and multimodal operations.

Date de sortie
2025-02-05
Paramètres
Longueur du contexte
1.0M
Modalités
audio, file, image, text, video

Radar de capacités

34
general
23
coding
39
reasoning
41
scienceest.
0
agents
80
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Code Ranking300
25.0
AA
General Ranking259
41.0
AA
Math Reasoning224
39.0
AA
Reasoning68
57.0
LS
Science246
43.0
AA

Scores de benchmarks (LLM Stats)

Audio

CoVoST239.2%Aut.

Biology

GPQA62.1%Aut.

Code

LiveCodeBench35.1%Aut.

Factuality

FACTS Grounding83.6%Aut.

Finance

MMLU-Pro76.4%Aut.

General

Natural2Code92.9%Aut.
MMMU70.7%Aut.
MRCR69.2%Aut.
Vibe-Eval56.3%Aut.

Long Context

EgoSchema71.5%Aut.

Math

MATH89.7%Aut.
HiddenMath63.0%Aut.

Reasoning

Bird-SQL (dev)56.9%Aut.

Indices d'évaluation AA

Math Index
21.7
Intelligence Index
18.5
Coding Index
13.6
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.6
Ifbench
0.4
Livecodebench
0.3
Scicode
0.3
Aime
0.3
Tau2
0.3
Lcr
0.3
Aime 25
0.2
Hle
0.1
Terminalbench Hard
0.0

Scores par catégorie LLM Stats

Factuality
80
Finance
80
Grounding
80
Language
80
Legal
80
Math
80
Vision
70
General
70
Healthcare
70
Long Context
70
Reasoning
70
Biology
60
Chemistry
60
Multimodal
60
Physics
60
Code
40

Tarification

Prix d'entrée$0.15 / 1M tokens
Prix de sortie$0.6 / 1M tokens
Prix mixte (3:1)$0.262 / 1M tokens

Vitesse

Tokens/sec0.0 tokens/s
Délai du premier token0.00s
Temps de réponse0.00s

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes