Saltar al contenido principal

Gemini 3.1 Flash-Lite Preview

GoogleGeminiProprietary

Descripción

Gemini 3.1 Flash-Lite is the first Flash-Lite model in the Gemini 3 series. It is optimized for high-volume, latency-sensitive tasks like translation, content moderation, and classification. It delivers enhanced performance at a fraction of the cost of larger models, with 2.5x faster Time to First Answer Token and 45% increased output speed compared to 2.5 Flash. Supports text, image, video, audio, and PDF input with a 1 million-token context window.

Fecha de lanzamiento
2026-03-03
Parámetros
Longitud del contexto
1.0M
Modalidades
audio, file, image, text, video

Radar de capacidades

30
general
32
coding
82
reasoning
55
scienceest.
0
agents
80
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Code Ranking113
57.0
AA
General Ranking155
57.0
AA
Multimodal Ranking55
73.0
LS
Science80
64.0
AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA86.9%Aut.

Factuality

SimpleQA43.3%Aut.
FACTS Grounding40.6%Aut.

General

MMMLU88.9%Aut.
MMMU-Pro76.8%Aut.
MRCR v2 (8-needle)60.1%Aut.

Healthcare

VideoMMMU84.8%Aut.

Math

Humanity's Last Exam16.0%Aut.

Multimodal

CharXiv-R73.2%Aut.

Índices de evaluación AA

Intelligence Index
33.5
Coding Index
30.1
Gpqa
0.8
Ifbench
0.8
Lcr
0.7
Scicode
0.4
Tau2
0.3
Terminalbench Hard
0.2
Hle
0.2

Puntuaciones por categoría LLM Stats

Biology
90
Chemistry
90
Language
90
Physics
90
General
80
Multimodal
80
Vision
60
Long Context
60
Reasoning
60
Healthcare
50
Math
50
Factuality
40
Grounding
40

Precios

Precio de entrada$0.25 / 1M tokens
Precio de salida$1.5 / 1M tokens
Precio mixto (3:1)$0.563 / 1M tokens

Velocidad

Tokens/seg340.2 tokens/s
Retraso del primer token4.97s
Tiempo hasta la respuesta4.97s

Proveedores disponibles

(Unidades internas LS)
ProveedorPrecio de entradaPrecio de salida
Google250K1.5M

Fuentes externas