メインコンテンツへスキップ

Gemini 2.5 Flash Preview (Sep '25) (Reasoning)

GoogleGemini

説明

A thinking model designed for a balance between price and performance. It builds upon Gemini 2.0 Flash with upgraded reasoning, hybrid thinking control, multimodal capabilities (text, image, video, audio input), and a 1M token input context window.

リリース日
2025-09-25
パラメータ
コンテキスト長
1.0M
モダリティ
audio, image, pdf, text, video

能力レーダー

40
general
64
coding
78
reasoning
52
science推定
74
agents
80
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
コーディングランキング114
63.0
AA
総合ランキング160
55.0
AA
数学的推論91
79.0
AA
科学127
57.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA82.8%自己申告

Code

Aider-Polyglot61.9%自己申告
SWE-Bench Verified60.4%自己申告
Aider-Polyglot Edit56.7%自己申告

Factuality

FACTS Grounding85.3%自己申告
SimpleQA26.9%自己申告

General

Global-MMLU-Lite88.4%自己申告
MMMU79.7%自己申告
Vibe-Eval65.4%自己申告
LiveCodeBench v563.9%自己申告
MRCR32.0%自己申告

Math

AIME 202488.0%自己申告
AIME 202572.0%自己申告
Humanity's Last Exam11.0%自己申告

AA評価指数

Math Index
78.3
Intelligence Index
23.8
Mmlu Pro
0.8
Gpqa
0.8
Aime 25
0.8
Livecodebench
0.7
Lcr
0.6
Ifbench
0.5
Tau2
0.5
Scicode
0.4
Terminalbench Hard
0.2
Hle
0.1

LLM Statsカテゴリスコア

Language
90
Grounding
90
Physics
80
Healthcare
80
Biology
80
Chemistry
80
Multimodal
70
Math
60
Reasoning
60
Factuality
60
Frontend Development
60
General
60
Code
60
Vision
50
Long Context
20

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料
キャッシュ読み取り価格$0.03 / 1Mトークン

速度

トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s

プロバイダー価格ランキング

プロバイダーデータがありません

外部リンク