Passer au contenu principal

Gemma 4 12B (Reasoning)

GoogleGemma
Date de sortie
2026-06-03
Paramètres
Longueur du contexte
131K
Modalités
image, text

Radar de capacités

26
general
27
coding
75
reasoning
50
scienceest.
61
agents
70
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement codage182
47.0
AA
Classement général194
52.0
AA
Science126
58.0
AA

Scores de benchmarks (LLM Stats)

Biology

GPQA42.4%Aut.

Code

HumanEval87.8%Aut.
LiveCodeBench29.7%Aut.

Factuality

FACTS Grounding74.9%Aut.
SimpleQA10.0%Aut.

Finance

MMLU-Pro67.5%Aut.

General

IFEval90.4%Aut.
Natural2Code84.5%Aut.
Global-MMLU-Lite75.1%Aut.
MBPP0.74 / 100Aut.
MMMU (val)64.9%Aut.
BIG-Bench Extra Hard19.3%Aut.

Image To Text

DocVQA86.6%Aut.
VQAv2 (val)71.0%Aut.
TextVQA65.1%Aut.

Language

BIG-Bench Hard87.6%Aut.
WMT24++53.4%Aut.
ECLeKTic16.7%Aut.

Math

GSM8k95.9%Aut.
MATH89.0%Aut.
MathVista-Mini67.6%Aut.
HiddenMath60.3%Aut.

Multimodal

AI2D84.5%Aut.
ChartQA78.0%Aut.
InfoVQA70.6%Aut.

Reasoning

Bird-SQL (dev)54.4%Aut.

Indices d'évaluation AA

Intelligence Index
29.1
Coding Index
24.9
Gpqa
0.8
Ifbench
0.7
Lcr
0.6
Scicode
0.4
Tau2
0.4
Terminalbench Hard
0.2
Hle
0.1

Scores par catégorie LLM Stats

Structured Output
90
Instruction Following
90
Math
80
Vision
70
Finance
70
Grounding
70
Healthcare
70
Image To Text
70
Legal
70
Multimodal
70
General
60
Language
60
Reasoning
60
Code
60
Factuality
40
Physics
40
Biology
40
Chemistry
40

Tarification

Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit

Vitesse

Tokens/sec0.0
Délai du premier token0.00s
Temps de réponse0.00s

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes