Gemma 2 9B
GoogleGemmaOpen WeightGemma · Commercial OK
Descripción
Gemma 2 9B IT is an instruction-tuned version of Google's Gemma 2 9B base model. It was trained on 8 trillion tokens of web data, code, and math content. The model features sliding window attention, logit soft-capping, and knowledge distillation techniques. It's optimized for dialogue applications through supervised fine-tuning, distillation, RLHF, and model merging using WARP.
Fecha de lanzamiento
2024-06-27
Parámetros
9.2B
Longitud del contexto
—
Modalidades
—
Radar de capacidades
70
general
40
coding
60
reasoning
68
scienceest.
0
agents
0
multimodal
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Reasoning | 29 | 82.0 | LS |
Puntuaciones de benchmarks (LLM Stats)
Code
HumanEval
40.2%Aut.
Creativity
Social IQa
53.4%Aut.
Finance
MMLU
71.3%Aut.
General
ARC-E
88.0%Aut.
PIQA
81.7%Aut.
TriviaQA
76.6%Aut.
ARC-C
68.4%Aut.
AGIEval
52.8%Aut.
MBPP
0.52 / 100Aut.
Natural Questions
29.2%Aut.
Language
BoolQ
84.2%Aut.
Winogrande
80.6%Aut.
BIG-Bench
68.2%Aut.
Math
GSM8k
68.6%Aut.
MATH
36.6%Aut.
Reasoning
HellaSwag
81.9%Aut.
Índices de evaluación AA
No hay datos de evaluación AA disponibles
Puntuaciones por categoría LLM Stats
Language80
Physics80
Finance70
General70
Healthcare70
Legal60
Math60
Reasoning60
Creativity50
Psychology50
Code40
Search30
Precios
No hay datos de precios disponibles
Velocidad
No hay datos de velocidad disponibles
Proveedores disponibles
(Unidades internas LS)No hay datos de proveedores disponibles