Granite 3.3 8B (Non-reasoning)
IBMOpen WeightApache 2.0 · Commercial OK
Описание
Granite-3.3-8B-Base is a decoder-only language model with a 128K token context window. It improves upon Granite-3.1-8B-Base by adding support for Fill-in-the-Middle (FIM) using specialized tokens, enabling the model to generate content conditioned on both prefix and suffix. This makes it well-suited for code completion tasks
Дата выхода
2025-04-16
Параметры
8.2B
Длина контекста
—
Модальности
text
Радар способностей
19
general
7
coding
18
reasoning
20
scienceоцен.
0
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 449 | 6.0 | AA |
| General Ranking | 455 | 17.0 | AA |
| Math Reasoning | 314 | 18.0 | AA |
| Reasoning | 24 | 83.0 | LS |
| Science | 439 | 17.0 | AA |
Оценки бенчмарков (LLM Stats)
Code
HumanEval
89.7%Сам.
Creativity
AlpacaEval 2.0
62.7%Сам.
Arena Hard
57.6%Сам.
Finance
MMLU
63.9%Сам.
TruthfulQA
52.1%Сам.
General
TriviaQA
78.2%Сам.
IFEval
74.8%Сам.
ARC-C
50.8%Сам.
AGIEval
49.3%Сам.
NQ
36.5%Сам.
PopQA
26.2%Сам.
Language
Winogrande
74.4%Сам.
BIG-Bench Hard
69.1%Сам.
Math
AIME 2024
81.2%Сам.
MATH-500
69.0%Сам.
GSM8k
59.0%Сам.
DROP
36.1%Сам.
Reasoning
HumanEval+
86.1%Сам.
HellaSwag
80.1%Сам.
Safety
AttaQ
88.5%Сам.
Индексы оценки AA
Intelligence Index7.0
Math Index6.7
Coding Index3.4
Math 5000.7
Mmlu Pro0.5
Gpqa0.3
Ifbench0.2
Livecodebench0.1
Tau20.1
Scicode0.1
Aime 250.1
Aime0.0
Lcr0.0
Hle0.0
Terminalbench Hard0.0
Оценки категорий LLM Stats
Code90
Safety90
Structured Output70
Instruction Following70
Language70
Writing60
Creativity60
Finance60
General60
Healthcare60
Legal60
Math60
Reasoning60
Цены
Цена ввода$0.03 / 1M tokens
Цена вывода$0.25 / 1M tokens
Смешанная цена (3:1)$0.085 / 1M tokens
Скорость
Токенов/сек308.3 tokens/s
Задержка первого токена21.55s
Время до первого ответа21.55s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров