メインコンテンツへスキップ

Gemini 2.0 Pro Experimental (Feb '25)

GoogleGemini

リリース日

2025-02-05

パラメータ

—

コンテキスト長

1.0M

モダリティ

audio, image, pdf, text, video

能力レーダー

32

general

29

coding

58

reasoning

40

science推定

60

agents

80

multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン	#順位	スコア	ソース
コーディングランキング	264	35.0	AA
総合ランキング	252	42.0	AA
数学的推論	138	65.0	AA
科学	267	42.0	AA

ベンチマークスコア (LLM Stats)

Agents

Vending-Bench 2

363500.0%自己申告

t2-bench

90.2%自己申告

MCP Atlas

57.4%自己申告

Toolathlon

49.4%自己申告

Terminal-Bench 2.0

47.6%自己申告

Finance Agent v2

42.5%自己申告

Legal Agent Benchmark

0.0%自己申告

Biology

GPQA

90.4%自己申告

Code

LiveCodeBench Pro

2316.00 / 3000自己申告

SWE-Bench Verified

78.0%自己申告

Factuality

SimpleQA

68.7%自己申告

FACTS Grounding

61.9%自己申告

General

Global PIQA

92.8%自己申告

MMMLU

91.8%自己申告

MMMU-Pro

81.2%自己申告

LiveBench

72.4%自己申告

MRCR v2 (8-needle)

22.1%自己申告

Grounding

ScreenSpot Pro

69.1%自己申告

Healthcare

VideoMMMU

86.9%自己申告

Math

AIME 2025

99.7%自己申告

Humanity's Last Exam

43.5%自己申告

Multimodal

CharXiv-R

80.3%自己申告

OmniDocBench 1.5

12.1%自己申告

Reasoning

ARC-AGI v2

33.6%自己申告

AA評価指数

Coding Index

25.5

Intelligence Index

11.8

Math 500

0.9

Mmlu Pro

0.8

Gpqa

0.6

Aime

0.4

Livecodebench

0.3

Scicode

0.3

Hle

0.1

LLM Statsカテゴリスコア

Code

100

Agents

100

General

100

Reasoning

100

Language

90

Physics

90

Biology

90

Chemistry

90

Math

80

Frontend Development

80

Multimodal

70

Factuality

70

Grounding

70

Tool Calling

60

Vision

60

Spatial Reasoning

50

Healthcare

50

Finance

40

Long Context

20

Structured Output

10

Legal

0

価格設定

入力価格無料

出力価格無料

混合価格（3:1）無料

キャッシュ読み取り価格$0.05 / 1Mトークン

速度

トークン/秒0.0

初トークン遅延0.00s

初回答遅延0.00s

プロバイダー価格ランキング

プロバイダーデータがありません

外部リンク

Artificial Analysis