Gemini 2.0 Pro Experimental (Feb '25)
GoogleGemini
リリース日
2025-02-05
パラメータ
—
コンテキスト長
1.0M
モダリティ
audio, image, pdf, text, video
能力レーダー
32
general
29
coding
58
reasoning
40
science推定
60
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 264 | 35.0 | AA |
| 総合ランキング | 252 | 42.0 | AA |
| 数学的推論 | 138 | 65.0 | AA |
| 科学 | 267 | 42.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
Vending-Bench 2
363500.0%自己申告
t2-bench
90.2%自己申告
MCP Atlas
57.4%自己申告
Toolathlon
49.4%自己申告
Terminal-Bench 2.0
47.6%自己申告
Finance Agent v2
42.5%自己申告
Legal Agent Benchmark
0.0%自己申告
Biology
GPQA
90.4%自己申告
Code
LiveCodeBench Pro
2316.00 / 3000自己申告
SWE-Bench Verified
78.0%自己申告
Factuality
SimpleQA
68.7%自己申告
FACTS Grounding
61.9%自己申告
General
Global PIQA
92.8%自己申告
MMMLU
91.8%自己申告
MMMU-Pro
81.2%自己申告
LiveBench
72.4%自己申告
MRCR v2 (8-needle)
22.1%自己申告
Grounding
ScreenSpot Pro
69.1%自己申告
Healthcare
VideoMMMU
86.9%自己申告
Math
AIME 2025
99.7%自己申告
Humanity's Last Exam
43.5%自己申告
Multimodal
CharXiv-R
80.3%自己申告
OmniDocBench 1.5
12.1%自己申告
Reasoning
ARC-AGI v2
33.6%自己申告
AA評価指数
Coding Index25.5
Intelligence Index11.8
Math 5000.9
Mmlu Pro0.8
Gpqa0.6
Aime0.4
Livecodebench0.3
Scicode0.3
Hle0.1
LLM Statsカテゴリスコア
Code100
Agents100
General100
Reasoning100
Language90
Physics90
Biology90
Chemistry90
Math80
Frontend Development80
Multimodal70
Factuality70
Grounding70
Tool Calling60
Vision60
Spatial Reasoning50
Healthcare50
Finance40
Long Context20
Structured Output10
Legal0
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
キャッシュ読み取り価格$0.05 / 1Mトークン
速度
トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s
プロバイダー価格ランキング
プロバイダーデータがありません