跳轉到主要內容

Gemini 2.0 Pro Experimental (Feb '25)

GoogleGemini

發布日期

2025-02-05

參數規模

—

上下文長度

1.0M

支援模態

audio, image, pdf, text, video

能力雷達圖

32

general

29

coding

58

reasoning

40

science估算

60

agents

80

multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域	#排名	分數	來源
程式碼能力榜	264	35.0	AA
通用能力榜	252	42.0	AA
數學推理	138	65.0	AA
科學能力	267	42.0	AA

基準測試分數 (LLM Stats)

Agents

Vending-Bench 2

363500.0%自報

t2-bench

90.2%自報

MCP Atlas

57.4%自報

Toolathlon

49.4%自報

Terminal-Bench 2.0

47.6%自報

Finance Agent v2

42.5%自報

Legal Agent Benchmark

0.0%自報

Biology

GPQA

90.4%自報

Code

LiveCodeBench Pro

2316.00 / 3000自報

SWE-Bench Verified

78.0%自報

Factuality

SimpleQA

68.7%自報

FACTS Grounding

61.9%自報

General

Global PIQA

92.8%自報

MMMLU

91.8%自報

MMMU-Pro

81.2%自報

LiveBench

72.4%自報

MRCR v2 (8-needle)

22.1%自報

Grounding

ScreenSpot Pro

69.1%自報

Healthcare

VideoMMMU

86.9%自報

Math

AIME 2025

99.7%自報

Humanity's Last Exam

43.5%自報

Multimodal

CharXiv-R

80.3%自報

OmniDocBench 1.5

12.1%自報

Reasoning

ARC-AGI v2

33.6%自報

AA 評測指數

Coding Index

25.5

Intelligence Index

11.8

Math 500

0.9

Mmlu Pro

0.8

Gpqa

0.6

Aime

0.4

Livecodebench

0.3

Scicode

0.3

Hle

0.1

LLM Stats 分類評分

Code

100

Agents

100

General

100

Reasoning

100

Language

90

Physics

90

Biology

90

Chemistry

90

Math

80

Frontend Development

80

Multimodal

70

Factuality

70

Grounding

70

Tool Calling

60

Vision

60

Spatial Reasoning

50

Healthcare

50

Finance

40

Long Context

20

Structured Output

10

Legal

0

定價

輸入價格免費

輸出價格免費

混合價格(3:1)免費

快取讀取價格$0.05 / 1M tokens

速度

Tokens/秒0.0

首Token延遲0.00s

首回答延遲0.00s

供應商價格排行

暫無提供商資料

外部連結

Artificial Analysis