Saltar al contenido principal

Gemma 2 9B

GoogleGemmaOpen WeightGemma · Commercial OK

Descripción

Gemma 2 9B IT is an instruction-tuned version of Google's Gemma 2 9B base model. It was trained on 8 trillion tokens of web data, code, and math content. The model features sliding window attention, logit soft-capping, and knowledge distillation techniques. It's optimized for dialogue applications through supervised fine-tuning, distillation, RLHF, and model merging using WARP.

Fecha de lanzamiento
2024-06-27
Parámetros
9.2B
Longitud del contexto
Modalidades

Radar de capacidades

70
general
40
coding
60
reasoning
68
scienceest.
0
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Reasoning29
82.0
LS

Puntuaciones de benchmarks (LLM Stats)

Code

HumanEval40.2%Aut.

Creativity

Social IQa53.4%Aut.

Finance

MMLU71.3%Aut.

General

ARC-E88.0%Aut.
PIQA81.7%Aut.
TriviaQA76.6%Aut.
ARC-C68.4%Aut.
AGIEval52.8%Aut.
MBPP0.52 / 100Aut.
Natural Questions29.2%Aut.

Language

BoolQ84.2%Aut.
Winogrande80.6%Aut.
BIG-Bench68.2%Aut.

Math

GSM8k68.6%Aut.
MATH36.6%Aut.

Reasoning

HellaSwag81.9%Aut.

Índices de evaluación AA

No hay datos de evaluación AA disponibles

Puntuaciones por categoría LLM Stats

Language
80
Physics
80
Finance
70
General
70
Healthcare
70
Legal
60
Math
60
Reasoning
60
Creativity
50
Psychology
50
Code
40
Search
30

Precios

No hay datos de precios disponibles

Velocidad

No hay datos de velocidad disponibles

Proveedores disponibles

(Unidades internas LS)

No hay datos de proveedores disponibles

Fuentes externas