Saltar al contenido principal

Gemma 4 12B (Non-reasoning)

GoogleGemma

Descripción

Gemma 4 12B is Google DeepMind's encoder-free multimodal instruction-tuned model with 11.95 billion parameters and a 256K context window. It supports text, image, audio, and video inputs with text output, projecting image patches and audio waveforms directly into a single decoder-only transformer for streamlined local deployment.

Fecha de lanzamiento
2026-06-03
Parámetros
Longitud del contexto
131K
Modalidades
image, text

Radar de capacidades

17
general
19
coding
66
reasoning
41
scienceest.
52
agents
50
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking de codificación285
29.0
AA
Ranking general356
32.0
AA
Ciencia262
42.0
AA

Puntuaciones de benchmarks (LLM Stats)

Audio

CoVoST238.5%Aut.

Biology

GPQA78.8%Aut.

Finance

MMLU-Pro77.2%Aut.

General

MMMLU83.4%Aut.
LiveCodeBench v672.0%Aut.
MMMU-Pro69.1%Aut.
BIG-Bench Extra Hard53.0%Aut.
MRCR v243.4%Aut.

Healthcare

MedXpertQA48.7%Aut.

Language

FLEURS93.1%Aut.

Math

MathVision79.7%Aut.
AIME 202677.5%Aut.
CodeForces0.55 / 3000Aut.
Humanity's Last Exam5.2%Aut.

Multimodal

OmniDocBench 1.516.4%Aut.

Índices de evaluación AA

Intelligence Index
19.5
Coding Index
17.5
Gpqa
0.7
Ifbench
0.5
Tau2
0.3
Lcr
0.3
Scicode
0.3
Terminalbench Hard
0.1
Hle
0.1

Puntuaciones por categoría LLM Stats

Finance
80
Legal
80
Physics
80
Biology
80
Chemistry
80
Speech To Text
70
General
70
Language
70
Reasoning
60
Healthcare
60
Math
60
Multimodal
50
Long Context
40
Vision
40
Audio
40
Structured Output
20

Precios

Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis

Velocidad

Tokens/seg0.0
Retraso del primer token0.00s
Tiempo hasta la respuesta0.00s

Ranking de Precios por Proveedor

No hay datos de proveedores disponibles

Fuentes externas