Saltar al contenido principal

Gemma 4 12B (Reasoning)

GoogleGemma
Fecha de lanzamiento
2026-06-03
Parámetros
Longitud del contexto
131K
Modalidades
image, text

Radar de capacidades

26
general
27
coding
75
reasoning
50
scienceest.
61
agents
70
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking de codificación182
47.0
AA
Ranking general194
52.0
AA
Ciencia126
58.0
AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA42.4%Aut.

Code

HumanEval87.8%Aut.
LiveCodeBench29.7%Aut.

Factuality

FACTS Grounding74.9%Aut.
SimpleQA10.0%Aut.

Finance

MMLU-Pro67.5%Aut.

General

IFEval90.4%Aut.
Natural2Code84.5%Aut.
Global-MMLU-Lite75.1%Aut.
MBPP0.74 / 100Aut.
MMMU (val)64.9%Aut.
BIG-Bench Extra Hard19.3%Aut.

Image To Text

DocVQA86.6%Aut.
VQAv2 (val)71.0%Aut.
TextVQA65.1%Aut.

Language

BIG-Bench Hard87.6%Aut.
WMT24++53.4%Aut.
ECLeKTic16.7%Aut.

Math

GSM8k95.9%Aut.
MATH89.0%Aut.
MathVista-Mini67.6%Aut.
HiddenMath60.3%Aut.

Multimodal

AI2D84.5%Aut.
ChartQA78.0%Aut.
InfoVQA70.6%Aut.

Reasoning

Bird-SQL (dev)54.4%Aut.

Índices de evaluación AA

Intelligence Index
29.1
Coding Index
24.9
Gpqa
0.8
Ifbench
0.7
Lcr
0.6
Scicode
0.4
Tau2
0.4
Terminalbench Hard
0.2
Hle
0.1

Puntuaciones por categoría LLM Stats

Structured Output
90
Instruction Following
90
Math
80
Vision
70
Finance
70
Grounding
70
Healthcare
70
Image To Text
70
Legal
70
Multimodal
70
General
60
Language
60
Reasoning
60
Code
60
Factuality
40
Physics
40
Biology
40
Chemistry
40

Precios

Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis

Velocidad

Tokens/seg0.0
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s

Ranking de Precios por Proveedor

No hay datos de proveedores disponibles

Fuentes externas