Перейти к основному содержанию

Gemma 2 9B

GoogleGemmaОткрытые весаGemma · Коммерческое использование

Описание

Gemma 2 9B IT is an instruction-tuned version of Google's Gemma 2 9B base model. It was trained on 8 trillion tokens of web data, code, and math content. The model features sliding window attention, logit soft-capping, and knowledge distillation techniques. It's optimized for dialogue applications through supervised fine-tuning, distillation, RLHF, and model merging using WARP.

Дата выхода
2024-06-27
Параметры
9.2B
Длина контекста
Модальности

Радар способностей

70
general
40
coding
60
reasoning
68
scienceоцен.
54
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рассуждения31
82.0
LS

Оценки бенчмарков (LLM Stats)

Code

HumanEval40.2%Сам.

Creativity

Social IQa53.4%Сам.

Finance

MMLU71.3%Сам.

General

ARC-E88.0%Сам.
PIQA81.7%Сам.
TriviaQA76.6%Сам.
ARC-C68.4%Сам.
AGIEval52.8%Сам.
MBPP0.52 / 100Сам.
Natural Questions29.2%Сам.

Language

BoolQ84.2%Сам.
Winogrande80.6%Сам.
BIG-Bench68.2%Сам.

Math

GSM8k68.6%Сам.
MATH36.6%Сам.

Reasoning

HellaSwag81.9%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Language
80
Physics
80
Finance
70
General
70
Healthcare
70
Legal
60
Math
60
Reasoning
60
Psychology
50
Creativity
50
Code
40
Search
30

Цены

Нет данных о ценах

Скорость

Нет данных о скорости

Рейтинг цен провайдеров

Рейтинг цен провайдеров

1 провайдеров

ПровайдерВводВывод
1Helicone
$0.01
$0.03

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки