Gemini 3 Pro Preview (low)
GoogleGeminiProprietary
説明
Gemini 3 Pro is the first model in the new Gemini 3 series. It is best for complex tasks that require broad world knowledge and advanced reasoning across modalities. Gemini 3 Pro uses dynamic thinking by default to reason through prompts, and features a 1 million-token input context window with 64k output tokens.
リリース日
2025-11-18
パラメータ
—
コンテキスト長
—
モダリティ
audio, image, text, video
能力レーダー
54
general
57
coding
87
reasoning
63
science推定
70
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 6 | 75.0 | LS |
| Code Ranking | 42 | 74.0 | AA |
| General Ranking | 82 | 71.0 | AA |
| Math Reasoning | 51 | 88.0 | AA |
| Multimodal Ranking | 70 | 42.0 | LS |
| Reasoning | 99 | 31.0 | LS |
| Science | 24 | 80.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
Vending-Bench 2
547816.0%自己申告
t2-bench
85.4%自己申告
Terminal-Bench 2.0
54.2%自己申告
Biology
GPQA
91.9%自己申告
Code
LiveCodeBench Pro
2439.00 / 3000自己申告
SWE-Bench Verified
76.2%自己申告
Factuality
SimpleQA
72.1%自己申告
FACTS Grounding
70.5%自己申告
General
Global PIQA
93.4%自己申告
MMMLU
91.8%自己申告
MMMU-Pro
81.0%自己申告
MRCR v2 (8-needle)
26.3%自己申告
Grounding
ScreenSpot Pro
72.7%自己申告
Healthcare
VideoMMMU
87.6%自己申告
Math
AIME 2025
100.0%自己申告
Humanity's Last Exam
45.8%自己申告
MathArena Apex
23.4%自己申告
Multimodal
CharXiv-R
81.4%自己申告
OmniDocBench 1.5
11.5%自己申告
Reasoning
ARC-AGI v2
31.1%自己申告
AA評価指数
Math Index86.7
Intelligence Index41.3
Coding Index39.4
Mmlu Pro0.9
Gpqa0.9
Aime 250.9
Livecodebench0.9
Tau20.7
Lcr0.7
Scicode0.5
Ifbench0.5
Terminalbench Hard0.3
Hle0.3
LLM Statsカテゴリスコア
Agents100
Code100
Reasoning100
General100
Biology90
Chemistry90
Healthcare90
Language90
Physics90
Frontend Development80
Tool Calling70
Factuality70
Grounding70
Math70
Multimodal70
Vision60
Spatial Reasoning50
Long Context30
Structured Output10
価格設定
入力価格$2 / 1M tokens
出力価格$12 / 1M tokens
混合価格(3:1)$4.5 / 1M tokens
速度
トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません