Gemini 2.0 Pro Experimental (Feb '25)
GoogleGemini
Fecha de lanzamiento
2025-02-05
Parámetros
—
Longitud del contexto
1.0M
Modalidades
audio, image, pdf, text, video
Radar de capacidades
32
general
29
coding
58
reasoning
40
scienceest.
60
agents
80
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Ranking de codificación | 264 | 35.0 | AA |
| Ranking general | 252 | 42.0 | AA |
| Razonamiento matemático | 138 | 65.0 | AA |
| Ciencia | 267 | 42.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Agents
Vending-Bench 2
363500.0%Aut.
t2-bench
90.2%Aut.
MCP Atlas
57.4%Aut.
Toolathlon
49.4%Aut.
Terminal-Bench 2.0
47.6%Aut.
Finance Agent v2
42.5%Aut.
Legal Agent Benchmark
0.0%Aut.
Biology
GPQA
90.4%Aut.
Code
LiveCodeBench Pro
2316.00 / 3000Aut.
SWE-Bench Verified
78.0%Aut.
Factuality
SimpleQA
68.7%Aut.
FACTS Grounding
61.9%Aut.
General
Global PIQA
92.8%Aut.
MMMLU
91.8%Aut.
MMMU-Pro
81.2%Aut.
LiveBench
72.4%Aut.
MRCR v2 (8-needle)
22.1%Aut.
Grounding
ScreenSpot Pro
69.1%Aut.
Healthcare
VideoMMMU
86.9%Aut.
Math
AIME 2025
99.7%Aut.
Humanity's Last Exam
43.5%Aut.
Multimodal
CharXiv-R
80.3%Aut.
OmniDocBench 1.5
12.1%Aut.
Reasoning
ARC-AGI v2
33.6%Aut.
Índices de evaluación AA
Coding Index25.5
Intelligence Index11.8
Math 5000.9
Mmlu Pro0.8
Gpqa0.6
Aime0.4
Livecodebench0.3
Scicode0.3
Hle0.1
Puntuaciones por categoría LLM Stats
Code100
Agents100
General100
Reasoning100
Language90
Physics90
Biology90
Chemistry90
Math80
Frontend Development80
Multimodal70
Factuality70
Grounding70
Tool Calling60
Vision60
Spatial Reasoning50
Healthcare50
Finance40
Long Context20
Structured Output10
Legal0
Precios
Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis
Precio de lectura caché$0.05 / 1M tokens
Velocidad
Tokens/seg0.0
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s
Ranking de Precios por Proveedor
No hay datos de proveedores disponibles