Granite 3.3 8B (Non-reasoning)
IBMОткрытые весаApache 2.0 · Коммерческое использование
Описание
Granite-3.3-8B-Base is a decoder-only language model with a 128K token context window. It improves upon Granite-3.1-8B-Base by adding support for Fill-in-the-Middle (FIM) using specialized tokens, enabling the model to generate content conditioned on both prefix and suffix. This makes it well-suited for code completion tasks
Дата выхода
2025-04-16
Параметры
8.2B
Длина контекста
—
Модальности
text
Радар способностей
16
general
12
coding
18
reasoning
20
scienceоцен.
16
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 467 | 7.0 | AA |
| Общий рейтинг | 484 | 15.0 | AA |
| Математическое мышление | 314 | 18.0 | AA |
| Рассуждения | 26 | 83.0 | LS |
| Наука | 460 | 17.0 | AA |
Оценки бенчмарков (LLM Stats)
Code
HumanEval
89.7%Сам.
Creativity
AlpacaEval 2.0
62.7%Сам.
Arena Hard
57.6%Сам.
Finance
MMLU
63.9%Сам.
TruthfulQA
52.1%Сам.
General
TriviaQA
78.2%Сам.
IFEval
74.8%Сам.
ARC-C
50.8%Сам.
AGIEval
49.3%Сам.
NQ
36.5%Сам.
PopQA
26.2%Сам.
Language
Winogrande
74.4%Сам.
BIG-Bench Hard
69.1%Сам.
Math
AIME 2024
81.2%Сам.
MATH-500
69.0%Сам.
GSM8k
59.0%Сам.
DROP
36.1%Сам.
Reasoning
HumanEval+
86.1%Сам.
HellaSwag
80.1%Сам.
Safety
AttaQ
88.5%Сам.
Индексы оценки AA
Math Index6.7
Intelligence Index1.8
Math 5000.7
Mmlu Pro0.5
Gpqa0.3
Ifbench0.2
Livecodebench0.1
Tau20.1
Scicode0.1
Aime 250.1
Aime0.0
Lcr0.0
Hle0.0
Terminalbench Hard0.0
Оценки категорий LLM Stats
Safety90
Code90
Instruction Following70
Language70
Structured Output70
Legal60
Math60
Reasoning60
Finance60
General60
Healthcare60
Creativity60
Writing60
Цены
Цена ввода$0.03 / 1M токенов
Цена вывода$0.25 / 1M токенов
Смешанная цена (3:1)$0.085 / 1M токенов
Скорость
Токенов/сек369.4
Задержка первого токена21.86s
Время до первого ответа21.86s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
1 провайдеров
ПровайдерВводВывод
1IBMОсновной
$0.03
$0.25
Сравнение цен разных API-провайдеров для этой модели.