跳转到主要内容

Gemini 2.0 Pro Experimental (Feb '25)

GoogleGemini
发布日期
2025-02-05
参数规模
上下文长度
1.0M
支持模态
audio, image, pdf, text, video

能力雷达图

32
general
29
coding
58
reasoning
40
science估算
60
agents
80
multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域#排名分数来源
代码能力榜264
35.0
AA
通用能力榜252
42.0
AA
数学推理138
65.0
AA
科学能力267
42.0
AA

基准测试分数 (LLM Stats)

Agents

Vending-Bench 2363500.0%自报
t2-bench90.2%自报
MCP Atlas57.4%自报
Toolathlon49.4%自报
Terminal-Bench 2.047.6%自报
Finance Agent v242.5%自报
Legal Agent Benchmark0.0%自报

Biology

GPQA90.4%自报

Code

LiveCodeBench Pro2316.00 / 3000自报
SWE-Bench Verified78.0%自报

Factuality

SimpleQA68.7%自报
FACTS Grounding61.9%自报

General

Global PIQA92.8%自报
MMMLU91.8%自报
MMMU-Pro81.2%自报
LiveBench72.4%自报
MRCR v2 (8-needle)22.1%自报

Grounding

ScreenSpot Pro69.1%自报

Healthcare

VideoMMMU86.9%自报

Math

AIME 202599.7%自报
Humanity's Last Exam43.5%自报

Multimodal

CharXiv-R80.3%自报
OmniDocBench 1.512.1%自报

Reasoning

ARC-AGI v233.6%自报

AA 评测指数

Coding Index
25.5
Intelligence Index
11.8
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.6
Aime
0.4
Livecodebench
0.3
Scicode
0.3
Hle
0.1

LLM Stats 分类评分

Code
100
Agents
100
General
100
Reasoning
100
Physics
90
Language
90
Biology
90
Chemistry
90
Math
80
Frontend Development
80
Multimodal
70
Factuality
70
Grounding
70
Tool Calling
60
Vision
60
Spatial Reasoning
50
Healthcare
50
Finance
40
Long Context
20
Structured Output
10
Legal
0

定价

输入价格免费
输出价格免费
混合价格(3:1)免费
缓存读取价格$0.05 / 1M tokens

速度

Tokens/秒0.0
首Token延迟0.00s
首回答延迟0.00s

供应商价格排行

暂无提供商数据

外部链接