跳轉到主要內容

Gemini 2.0 Pro Experimental (Feb '25)

GoogleGemini
發布日期
2025-02-05
參數規模
上下文長度
1.0M
支援模態
audio, image, pdf, text, video

能力雷達圖

32
general
29
coding
58
reasoning
40
science估算
60
agents
80
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域#排名分數來源
程式碼能力榜264
35.0
AA
通用能力榜252
42.0
AA
數學推理138
65.0
AA
科學能力267
42.0
AA

基準測試分數 (LLM Stats)

Agents

Vending-Bench 2363500.0%自報
t2-bench90.2%自報
MCP Atlas57.4%自報
Toolathlon49.4%自報
Terminal-Bench 2.047.6%自報
Finance Agent v242.5%自報
Legal Agent Benchmark0.0%自報

Biology

GPQA90.4%自報

Code

LiveCodeBench Pro2316.00 / 3000自報
SWE-Bench Verified78.0%自報

Factuality

SimpleQA68.7%自報
FACTS Grounding61.9%自報

General

Global PIQA92.8%自報
MMMLU91.8%自報
MMMU-Pro81.2%自報
LiveBench72.4%自報
MRCR v2 (8-needle)22.1%自報

Grounding

ScreenSpot Pro69.1%自報

Healthcare

VideoMMMU86.9%自報

Math

AIME 202599.7%自報
Humanity's Last Exam43.5%自報

Multimodal

CharXiv-R80.3%自報
OmniDocBench 1.512.1%自報

Reasoning

ARC-AGI v233.6%自報

AA 評測指數

Coding Index
25.5
Intelligence Index
11.8
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.6
Aime
0.4
Livecodebench
0.3
Scicode
0.3
Hle
0.1

LLM Stats 分類評分

Code
100
Agents
100
General
100
Reasoning
100
Language
90
Physics
90
Biology
90
Chemistry
90
Math
80
Frontend Development
80
Multimodal
70
Factuality
70
Grounding
70
Tool Calling
60
Vision
60
Spatial Reasoning
50
Healthcare
50
Finance
40
Long Context
20
Structured Output
10
Legal
0

定價

輸入價格免費
輸出價格免費
混合價格(3:1)免費
快取讀取價格$0.05 / 1M tokens

速度

Tokens/秒0.0
首Token延遲0.00s
首回答延遲0.00s

供應商價格排行

暫無提供商資料

外部連結