Gemini 2.0 Pro Experimental (Feb '25)
GoogleGemini
Date de sortie
2025-02-05
Paramètres
—
Longueur du contexte
1.0M
Modalités
audio, image, pdf, text, video
Radar de capacités
32
general
29
coding
58
reasoning
40
scienceest.
60
agents
80
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Classement codage | 264 | 35.0 | AA |
| Classement général | 252 | 42.0 | AA |
| Raisonnement mathématique | 138 | 65.0 | AA |
| Science | 267 | 42.0 | AA |
Scores de benchmarks (LLM Stats)
Agents
Vending-Bench 2
363500.0%Aut.
t2-bench
90.2%Aut.
MCP Atlas
57.4%Aut.
Toolathlon
49.4%Aut.
Terminal-Bench 2.0
47.6%Aut.
Finance Agent v2
42.5%Aut.
Legal Agent Benchmark
0.0%Aut.
Biology
GPQA
90.4%Aut.
Code
LiveCodeBench Pro
2316.00 / 3000Aut.
SWE-Bench Verified
78.0%Aut.
Factuality
SimpleQA
68.7%Aut.
FACTS Grounding
61.9%Aut.
General
Global PIQA
92.8%Aut.
MMMLU
91.8%Aut.
MMMU-Pro
81.2%Aut.
LiveBench
72.4%Aut.
MRCR v2 (8-needle)
22.1%Aut.
Grounding
ScreenSpot Pro
69.1%Aut.
Healthcare
VideoMMMU
86.9%Aut.
Math
AIME 2025
99.7%Aut.
Humanity's Last Exam
43.5%Aut.
Multimodal
CharXiv-R
80.3%Aut.
OmniDocBench 1.5
12.1%Aut.
Reasoning
ARC-AGI v2
33.6%Aut.
Indices d'évaluation AA
Coding Index25.5
Intelligence Index11.8
Math 5000.9
Mmlu Pro0.8
Gpqa0.6
Aime0.4
Livecodebench0.3
Scicode0.3
Hle0.1
Scores par catégorie LLM Stats
Code100
Agents100
General100
Reasoning100
Language90
Physics90
Biology90
Chemistry90
Math80
Frontend Development80
Multimodal70
Factuality70
Grounding70
Tool Calling60
Vision60
Spatial Reasoning50
Healthcare50
Finance40
Long Context20
Structured Output10
Legal0
Tarification
Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit
Prix de lecture cache$0.05 / 1M tokens
Vitesse
Tokens/sec0.0
Délai du premier token0.00s
Temps de réponse0.00s
Classement des Prix par Fournisseur
Aucune donnée de fournisseur disponible