Passer au contenu principal

Gemini 3.1 Flash-Lite Preview

GoogleGeminiProprietary

Description

Gemini 3.1 Flash-Lite is the first Flash-Lite model in the Gemini 3 series. It is optimized for high-volume, latency-sensitive tasks like translation, content moderation, and classification. It delivers enhanced performance at a fraction of the cost of larger models, with 2.5x faster Time to First Answer Token and 45% increased output speed compared to 2.5 Flash. Supports text, image, video, audio, and PDF input with a 1 million-token context window.

Date de sortie
2026-03-03
Paramètres
Longueur du contexte
1.0M
Modalités
audio, file, image, text, video

Radar de capacités

30
general
32
coding
82
reasoning
55
scienceest.
0
agents
80
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Code Ranking113
57.0
AA
General Ranking155
57.0
AA
Multimodal Ranking55
73.0
LS
Science80
64.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA86.9%Aut.

Factuality

SimpleQA43.3%Aut.
FACTS Grounding40.6%Aut.

General

MMMLU88.9%Aut.
MMMU-Pro76.8%Aut.
MRCR v2 (8-needle)60.1%Aut.

Healthcare

VideoMMMU84.8%Aut.

Math

Humanity's Last Exam16.0%Aut.

Multimodal

CharXiv-R73.2%Aut.

Indices d'évaluation AA

Intelligence Index
33.5
Coding Index
30.1
Gpqa
0.8
Ifbench
0.8
Lcr
0.7
Scicode
0.4
Tau2
0.3
Terminalbench Hard
0.2
Hle
0.2

Scores par catégorie LLM Stats

Biology
90
Chemistry
90
Language
90
Physics
90
General
80
Multimodal
80
Vision
60
Long Context
60
Reasoning
60
Healthcare
50
Math
50
Factuality
40
Grounding
40

Tarification

Prix d'entrée$0.25 / 1M tokens
Prix de sortie$1.5 / 1M tokens
Prix mixte (3:1)$0.563 / 1M tokens

Vitesse

Tokens/sec340.2 tokens/s
Délai du premier token4.97s
Temps de réponse4.97s

Fournisseurs disponibles

(Unités internes LS)
FournisseurPrix d'entréePrix de sortie
Google250K1.5M

Sources externes