メインコンテンツへスキップ

Gemini 2.0 Pro Experimental (Feb '25)

GoogleGemini
リリース日
2025-02-05
パラメータ
コンテキスト長
1.0M
モダリティ
audio, image, pdf, text, video

能力レーダー

32
general
29
coding
58
reasoning
40
science推定
60
agents
80
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
コーディングランキング264
35.0
AA
総合ランキング252
42.0
AA
数学的推論138
65.0
AA
科学267
42.0
AA

ベンチマークスコア (LLM Stats)

Agents

Vending-Bench 2363500.0%自己申告
t2-bench90.2%自己申告
MCP Atlas57.4%自己申告
Toolathlon49.4%自己申告
Terminal-Bench 2.047.6%自己申告
Finance Agent v242.5%自己申告
Legal Agent Benchmark0.0%自己申告

Biology

GPQA90.4%自己申告

Code

LiveCodeBench Pro2316.00 / 3000自己申告
SWE-Bench Verified78.0%自己申告

Factuality

SimpleQA68.7%自己申告
FACTS Grounding61.9%自己申告

General

Global PIQA92.8%自己申告
MMMLU91.8%自己申告
MMMU-Pro81.2%自己申告
LiveBench72.4%自己申告
MRCR v2 (8-needle)22.1%自己申告

Grounding

ScreenSpot Pro69.1%自己申告

Healthcare

VideoMMMU86.9%自己申告

Math

AIME 202599.7%自己申告
Humanity's Last Exam43.5%自己申告

Multimodal

CharXiv-R80.3%自己申告
OmniDocBench 1.512.1%自己申告

Reasoning

ARC-AGI v233.6%自己申告

AA評価指数

Coding Index
25.5
Intelligence Index
11.8
Math 500
0.9
Mmlu Pro
0.8
Gpqa
0.6
Aime
0.4
Livecodebench
0.3
Scicode
0.3
Hle
0.1

LLM Statsカテゴリスコア

Code
100
Agents
100
General
100
Reasoning
100
Language
90
Physics
90
Biology
90
Chemistry
90
Math
80
Frontend Development
80
Multimodal
70
Factuality
70
Grounding
70
Tool Calling
60
Vision
60
Spatial Reasoning
50
Healthcare
50
Finance
40
Long Context
20
Structured Output
10
Legal
0

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料
キャッシュ読み取り価格$0.05 / 1Mトークン

速度

トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s

プロバイダー価格ランキング

プロバイダーデータがありません

外部リンク