Gemma 2 9B
GoogleGemmaOpen WeightGemma · Commercial OK
Description
Gemma 2 9B IT is an instruction-tuned version of Google's Gemma 2 9B base model. It was trained on 8 trillion tokens of web data, code, and math content. The model features sliding window attention, logit soft-capping, and knowledge distillation techniques. It's optimized for dialogue applications through supervised fine-tuning, distillation, RLHF, and model merging using WARP.
Date de sortie
2024-06-27
Paramètres
9.2B
Longueur du contexte
—
Modalités
—
Radar de capacités
70
general
40
coding
60
reasoning
68
scienceest.
0
agents
0
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Reasoning | 29 | 82.0 | LS |
Scores de benchmarks (LLM Stats)
Code
HumanEval
40.2%Aut.
Creativity
Social IQa
53.4%Aut.
Finance
MMLU
71.3%Aut.
General
ARC-E
88.0%Aut.
PIQA
81.7%Aut.
TriviaQA
76.6%Aut.
ARC-C
68.4%Aut.
AGIEval
52.8%Aut.
MBPP
0.52 / 100Aut.
Natural Questions
29.2%Aut.
Language
BoolQ
84.2%Aut.
Winogrande
80.6%Aut.
BIG-Bench
68.2%Aut.
Math
GSM8k
68.6%Aut.
MATH
36.6%Aut.
Reasoning
HellaSwag
81.9%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Language80
Physics80
Finance70
General70
Healthcare70
Legal60
Math60
Reasoning60
Creativity50
Psychology50
Code40
Search30
Tarification
Aucune donnée de prix disponible
Vitesse
Aucune donnée de vitesse disponible
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible