मुख्य सामग्री पर जाएं

Gemini 2.0 Pro Experimental (Feb '25)

GoogleGemini
रिलीज़ तिथि
2025-02-05
पैरामीटर
संदर्भ लंबाई
1.0M
मोडैलिटीज़
audio, image, pdf, text, video

क्षमता रडार

32
general
29
coding
58
reasoning
40
scienceअनुमानित
60
agents
80
multimodal

समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।

रैंकिंग

डोमेन#रैंकस्कोरस्रोत
कोडिंग रैंकिंग264
35.0
AA
सामान्य रैंकिंग252
42.0
AA
गणितीय तर्क138
65.0
AA
विज्ञान267
42.0
AA

बेंचमार्क स्कोर (LLM Stats)

Agents

Vending-Bench 2363500.0%स्वयं
t2-bench90.2%स्वयं
MCP Atlas57.4%स्वयं
Toolathlon49.4%स्वयं
Terminal-Bench 2.047.6%स्वयं
Finance Agent v242.5%स्वयं
Legal Agent Benchmark0.0%स्वयं

Biology

GPQA90.4%स्वयं

Code

LiveCodeBench Pro2316.00 / 3000स्वयं
SWE-Bench Verified78.0%स्वयं

Factuality

SimpleQA68.7%स्वयं
FACTS Grounding61.9%स्वयं

General

Global PIQA92.8%स्वयं
MMMLU91.8%स्वयं
MMMU-Pro81.2%स्वयं
LiveBench72.4%स्वयं
MRCR v2 (8-needle)22.1%स्वयं

Grounding

ScreenSpot Pro69.1%स्वयं

Healthcare

VideoMMMU86.9%स्वयं

Math

AIME 202599.7%स्वयं
Humanity's Last Exam43.5%स्वयं

Multimodal

CharXiv-R80.3%स्वयं
OmniDocBench 1.512.1%स्वयं

Reasoning

ARC-AGI v233.6%स्वयं

AA मूल्यांकन सूचकांक

Coding Index
25.5
Intelligence Index
11.8
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.6
Aime
0.4
Livecodebench
0.3
Scicode
0.3
Hle
0.1

LLM Stats श्रेणी स्कोर

Code
100
Agents
100
General
100
Reasoning
100
Language
90
Physics
90
Biology
90
Chemistry
90
Math
80
Frontend Development
80
Multimodal
70
Factuality
70
Grounding
70
Tool Calling
60
Vision
60
Spatial Reasoning
50
Healthcare
50
Finance
40
Long Context
20
Structured Output
10
Legal
0

मूल्य निर्धारण

इनपुट मूल्यमुफ्त
आउटपुट मूल्यमुफ्त
मिश्रित मूल्य (3:1)मुफ्त
कैश पठन मूल्य$0.05 / 1M टोकन

गति

टोकन/सेकंड0.0
पहले टोकन में देरी0.00s
पहले उत्तर में देरी0.00s

प्रदाता मूल्य रैंकिंग

कोई प्रदाता डेटा उपलब्ध नहीं

बाहरी लिंक