Gemini 2.5 Flash Preview (Sep '25) (Reasoning)

GoogleGemini

Description

A thinking model designed for a balance between price and performance. It builds upon Gemini 2.0 Flash with upgraded reasoning, hybrid thinking control, multimodal capabilities (text, image, video, audio input), and a 1M token input context window.

Date de sortie

2025-09-25

Paramètres

—

Longueur du contexte

1.0M

Modalités

audio, image, pdf, text, video

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement codage	114	63.0	AA
Classement général	160	55.0	AA
Raisonnement mathématique	91	79.0	AA
Science	127	57.0	AA

Scores de benchmarks (LLM Stats)

Biology

GPQA

82.8%Aut.

Code

Aider-Polyglot

61.9%Aut.

SWE-Bench Verified

60.4%Aut.

Aider-Polyglot Edit

56.7%Aut.

Factuality

FACTS Grounding

85.3%Aut.

SimpleQA

26.9%Aut.

General

Global-MMLU-Lite

88.4%Aut.

MMMU

79.7%Aut.

Vibe-Eval

65.4%Aut.

LiveCodeBench v5

63.9%Aut.

MRCR

32.0%Aut.

Math

AIME 2024

88.0%Aut.

AIME 2025

72.0%Aut.

Humanity's Last Exam

11.0%Aut.

Indices d'évaluation AA

Math Index

78.3

Intelligence Index

23.8

Mmlu Pro

0.8

Gpqa

0.8

Aime 25

0.8

Livecodebench

0.7

Lcr

0.6

Ifbench

0.5

Tau2

0.5

Scicode

0.4

Terminalbench Hard

0.2

Hle

0.1

Scores par catégorie LLM Stats

Language

Grounding

Physics

Healthcare

Biology

Chemistry

Multimodal

Math

Reasoning

Factuality

Frontend Development

General

Code

Vision

Long Context

Tarification

Prix d'entréeGratuit

Prix de sortieGratuit

Prix mixte (3:1)Gratuit

Prix de lecture cache$0.03 / 1M tokens

Vitesse

Tokens/sec0.0

Délai du premier token0.00s

Temps de réponse0.00s

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes

Artificial Analysis