Gemini 1.5 Flash (Sep '24)
GoogleGeminiProprietary
説明
Gemini 1.5 Flash is a fast and versatile multimodal model for scaling across diverse tasks. It supports audio, images, video, and text input, and produces text output. The model is optimized for generating code, extracting data, editing text, and more, making it ideal for narrow, high-frequency tasks.
リリース日
2024-09-24
パラメータ
—
コンテキスト長
—
モダリティ
image, text
能力レーダー
29
general
27
coding
43
reasoning
31
science推定
0
agents
80
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 268 | 30.0 | AA |
| General Ranking | 316 | 35.0 | AA |
| Math Reasoning | 180 | 51.0 | AA |
| Multimodal Ranking | 39 | 76.0 | LS |
| Reasoning | 16 | 87.0 | LS |
| Science | 350 | 31.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
51.0%自己申告
Code
HumanEval
74.3%自己申告
Finance
MMLU
78.9%自己申告
MMLU-Pro
67.3%自己申告
General
Natural2Code
79.8%自己申告
MRCR
71.9%自己申告
MMMU
62.3%自己申告
Vibe-Eval
48.9%自己申告
Healthcare
WMT23
74.1%自己申告
Language
BIG-Bench Hard
85.5%自己申告
FLEURS
0.10 / 100自己申告
Math
GSM8k
86.2%自己申告
MGSM
82.6%自己申告
MATH
77.9%自己申告
MathVista
65.8%自己申告
PhysicsFinals
57.4%自己申告
FunctionalMATH
53.6%自己申告
HiddenMath
47.2%自己申告
AMC_2022_23
34.8%自己申告
Multimodal
Video-MME
76.1%自己申告
Reasoning
HellaSwag
86.5%自己申告
Safety
XSTest
97.0%自己申告
AA評価指数
Intelligence Index13.8
Math 5000.8
Mmlu Pro0.7
Gpqa0.5
Livecodebench0.3
Scicode0.3
Aime0.2
Hle0.0
LLM Statsカテゴリスコア
Safety100
Code70
Finance70
General70
Healthcare70
Legal70
Long Context70
Math70
Reasoning70
Vision60
Language60
Multimodal60
Biology50
Chemistry50
Physics50
Speech To Text10
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
速度
トークン/秒0.0 tokens/s
初トークン遅延0.00s
初回答遅延0.00s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません