跳轉到主要內容

Gemma 2 9B

GoogleGemmaOpen WeightGemma · Commercial OK

描述

Gemma 2 9B IT is an instruction-tuned version of Google's Gemma 2 9B base model. It was trained on 8 trillion tokens of web data, code, and math content. The model features sliding window attention, logit soft-capping, and knowledge distillation techniques. It's optimized for dialogue applications through supervised fine-tuning, distillation, RLHF, and model merging using WARP.

發布日期
2024-06-27
參數規模
9.2B
上下文長度
支援模態

能力雷達圖

70
general
40
coding
60
reasoning
68
science估算
0
agents
0
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域#排名分數來源
推理能力29
82.0
LS

基準測試分數 (LLM Stats)

Code

HumanEval40.2%自報

Creativity

Social IQa53.4%自報

Finance

MMLU71.3%自報

General

ARC-E88.0%自報
PIQA81.7%自報
TriviaQA76.6%自報
ARC-C68.4%自報
AGIEval52.8%自報
MBPP0.52 / 100自報
Natural Questions29.2%自報

Language

BoolQ84.2%自報
Winogrande80.6%自報
BIG-Bench68.2%自報

Math

GSM8k68.6%自報
MATH36.6%自報

Reasoning

HellaSwag81.9%自報

AA 評測指數

暫無 AA 評測資料

LLM Stats 分類評分

Language
80
Physics
80
Finance
70
General
70
Healthcare
70
Legal
60
Math
60
Reasoning
60
Creativity
50
Psychology
50
Code
40
Search
30

定價

暫無定價資料

速度

暫無速度資料

可用提供商

(LS 內部計價單位)

暫無提供商資料

外部連結