Passer au contenu principal

Gemma 2 9B

GoogleGemmaOpen WeightGemma · Commercial OK

Description

Gemma 2 9B IT is an instruction-tuned version of Google's Gemma 2 9B base model. It was trained on 8 trillion tokens of web data, code, and math content. The model features sliding window attention, logit soft-capping, and knowledge distillation techniques. It's optimized for dialogue applications through supervised fine-tuning, distillation, RLHF, and model merging using WARP.

Date de sortie
2024-06-27
Paramètres
9.2B
Longueur du contexte
Modalités

Radar de capacités

70
general
40
coding
60
reasoning
68
scienceest.
0
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Reasoning29
82.0
LS

Scores de benchmarks (LLM Stats)

Code

HumanEval40.2%Aut.

Creativity

Social IQa53.4%Aut.

Finance

MMLU71.3%Aut.

General

ARC-E88.0%Aut.
PIQA81.7%Aut.
TriviaQA76.6%Aut.
ARC-C68.4%Aut.
AGIEval52.8%Aut.
MBPP0.52 / 100Aut.
Natural Questions29.2%Aut.

Language

BoolQ84.2%Aut.
Winogrande80.6%Aut.
BIG-Bench68.2%Aut.

Math

GSM8k68.6%Aut.
MATH36.6%Aut.

Reasoning

HellaSwag81.9%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Language
80
Physics
80
Finance
70
General
70
Healthcare
70
Legal
60
Math
60
Reasoning
60
Creativity
50
Psychology
50
Code
40
Search
30

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes