Перейти к основному содержанию

Granite 3.3 8B (Non-reasoning)

IBMОткрытые весаApache 2.0 · Коммерческое использование

Описание

Granite-3.3-8B-Base is a decoder-only language model with a 128K token context window. It improves upon Granite-3.1-8B-Base by adding support for Fill-in-the-Middle (FIM) using specialized tokens, enabling the model to generate content conditioned on both prefix and suffix. This makes it well-suited for code completion tasks

Дата выхода
2025-04-16
Параметры
8.2B
Длина контекста
Модальности
text

Радар способностей

16
general
12
coding
18
reasoning
20
scienceоцен.
16
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга467
7.0
AA
Общий рейтинг484
15.0
AA
Математическое мышление314
18.0
AA
Рассуждения26
83.0
LS
Наука460
17.0
AA

Оценки бенчмарков (LLM Stats)

Code

HumanEval89.7%Сам.

Creativity

AlpacaEval 2.062.7%Сам.
Arena Hard57.6%Сам.

Finance

MMLU63.9%Сам.
TruthfulQA52.1%Сам.

General

TriviaQA78.2%Сам.
IFEval74.8%Сам.
ARC-C50.8%Сам.
AGIEval49.3%Сам.
NQ36.5%Сам.
PopQA26.2%Сам.

Language

Winogrande74.4%Сам.
BIG-Bench Hard69.1%Сам.

Math

AIME 202481.2%Сам.
MATH-50069.0%Сам.
GSM8k59.0%Сам.
DROP36.1%Сам.

Reasoning

HumanEval+86.1%Сам.
HellaSwag80.1%Сам.

Safety

AttaQ88.5%Сам.

Индексы оценки AA

Math Index
6.7
Intelligence Index
1.8
Math 500
0.7
Mmlu Pro
0.5
Gpqa
0.3
Ifbench
0.2
Livecodebench
0.1
Tau2
0.1
Scicode
0.1
Aime 25
0.1
Aime
0.0
Lcr
0.0
Hle
0.0
Terminalbench Hard
0.0

Оценки категорий LLM Stats

Safety
90
Code
90
Instruction Following
70
Language
70
Structured Output
70
Legal
60
Math
60
Reasoning
60
Finance
60
General
60
Healthcare
60
Creativity
60
Writing
60

Цены

Цена ввода$0.03 / 1M токенов
Цена вывода$0.25 / 1M токенов
Смешанная цена (3:1)$0.085 / 1M токенов

Скорость

Токенов/сек369.4
Задержка первого токена21.86s
Время до первого ответа21.86s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

1 провайдеров

ПровайдерВводВывод
1IBMОсновной
$0.03
$0.25

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки