Saltar al contenido principal

DiffusionGemma 26B-A4B

GoogleGemmaOpen WeightApache 2.0 · Uso Comercial

Descripción

DiffusionGemma 26B-A4B is Google DeepMind's experimental open-weights text diffusion model based on the Gemma 4 26B-A4B Mixture-of-Experts architecture. It uses discrete diffusion to denoise 256-token canvases in parallel, targeting low-latency local and low-concurrency generation workloads with up to 4x faster text generation on dedicated GPUs. The model has 25.2 billion total parameters, 3.8 billion active parameters, a 256K context window, and multimodal text and image inputs.

Fecha de lanzamiento
2026-06-10
Parámetros
25.2B
Longitud del contexto
Modalidades

Radar de capacidades

60
general
0
coding
60
reasoning
60
scienceest.
60
agents
50
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Capacidad agéntica65
56.0
LS
Ranking multimodal79
32.0
LS

Puntuaciones de benchmarks (LLM Stats)

Agents

t2-bench56.2%Aut.

Biology

GPQA73.2%Aut.

Finance

MMLU-Pro77.6%Aut.

General

MMMLU81.5%Aut.
LiveCodeBench v669.1%Aut.
MMMU-Pro54.3%Aut.
BIG-Bench Extra Hard47.6%Aut.
MRCR v232.0%Aut.

Healthcare

MedXpertQA49.0%Aut.

Math

MathVision70.5%Aut.
AIME 202669.1%Aut.
CodeForces0.48 / 3000Aut.
Humanity's Last Exam11.9%Aut.

Multimodal

OmniDocBench 1.531.9%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

Finance
80
Legal
80
Language
70
Physics
70
Biology
70
Chemistry
70
General
60
Healthcare
60
Tool Calling
60
Math
60
Agents
60
Reasoning
50
Multimodal
50
Vision
40
Structured Output
30
Long Context
30

Precios

No hay datos de precios disponibles

Velocidad

No hay datos de velocidad disponibles

Ranking de Precios por Proveedor

No hay datos de proveedores disponibles

Fuentes externas