メインコンテンツへスキップ

Gemma 3 12B Instruct

GoogleGemmaOpen WeightGemma · Commercial OK

説明

Gemma 3 12B is a 12-billion-parameter vision-language model from Google, handling text and image input and generating text output. It features a 128K context window, multilingual support, and open weights. Suitable for question answering, summarization, reasoning, and image understanding tasks.

リリース日
2025-03-12
パラメータ
12.0B
コンテキスト長
131K
モダリティ
image, text

能力レーダー

23
general
10
coding
31
reasoning
23
science推定
0
agents
80
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking430
9.0
AA
General Ranking400
25.0
AA
Math Reasoning256
32.0
AA
Multimodal Ranking41
76.0
LS
Reasoning91
48.0
LS
Science403
23.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA40.9%自己申告

Code

HumanEval85.4%自己申告
LiveCodeBench24.6%自己申告

Factuality

FACTS Grounding75.8%自己申告
SimpleQA6.3%自己申告

Finance

MMLU-Pro60.6%自己申告

General

IFEval88.9%自己申告
Natural2Code80.7%自己申告
MBPP0.73 / 100自己申告
Global-MMLU-Lite69.5%自己申告
MMMU (val)59.6%自己申告
BIG-Bench Extra Hard16.3%自己申告

Image To Text

DocVQA87.1%自己申告
VQAv2 (val)71.6%自己申告
TextVQA67.7%自己申告

Language

BIG-Bench Hard85.7%自己申告
WMT24++51.6%自己申告
ECLeKTic10.3%自己申告

Math

GSM8k94.4%自己申告
MATH83.8%自己申告
MathVista-Mini62.9%自己申告
HiddenMath54.5%自己申告

Multimodal

AI2D84.2%自己申告
ChartQA75.7%自己申告
InfoVQA64.9%自己申告

Reasoning

Bird-SQL (dev)47.9%自己申告

AA評価指数

Math Index
18.3
Intelligence Index
8.8
Coding Index
6.3
Math 500
0.9
Mmlu Pro
0.6
Ifbench
0.4
Gpqa
0.3
Aime
0.2
Aime 25
0.2
Scicode
0.2
Livecodebench
0.1
Tau2
0.1
Lcr
0.1
Hle
0.0
Terminalbench Hard
0.0

LLM Statsカテゴリスコア

Structured Output
90
Instruction Following
90
Grounding
80
Image To Text
80
Vision
70
Math
70
Multimodal
70
Code
60
Finance
60
Healthcare
60
Legal
60
Reasoning
60
General
50
Language
50
Biology
40
Chemistry
40
Factuality
40
Physics
40

価格設定

入力価格$0.09 / 1M tokens
出力価格$0.29 / 1M tokens
混合価格(3:1)$0.14 / 1M tokens

速度

トークン/秒27.2 tokens/s
初トークン遅延1.77s
初回答遅延1.77s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク