Granite 3.3 8B (Non-reasoning)

IBMОткрытые весаApache 2.0 · Коммерческое использование

Описание

Granite-3.3-8B-Base is a decoder-only language model with a 128K token context window. It improves upon Granite-3.1-8B-Base by adding support for Fill-in-the-Middle (FIM) using specialized tokens, enabling the model to generate content conditioned on both prefix and suffix. This makes it well-suited for code completion tasks

Дата выхода

2025-04-16

Параметры

8.2B

Длина контекста

—

Модальности

text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	467	7.0	AA
Общий рейтинг	484	15.0	AA
Математическое мышление	314	18.0	AA
Рассуждения	26	83.0	LS
Наука	460	17.0	AA

Оценки бенчмарков (LLM Stats)

Code

HumanEval

89.7%Сам.

Creativity

AlpacaEval 2.0

62.7%Сам.

Arena Hard

57.6%Сам.

Finance

MMLU

63.9%Сам.

TruthfulQA

52.1%Сам.

General

TriviaQA

78.2%Сам.

IFEval

74.8%Сам.

ARC-C

50.8%Сам.

AGIEval

49.3%Сам.

36.5%Сам.

PopQA

26.2%Сам.

Language

Winogrande

74.4%Сам.

BIG-Bench Hard

69.1%Сам.

Math

AIME 2024

81.2%Сам.

MATH-500

69.0%Сам.

GSM8k

59.0%Сам.

DROP

36.1%Сам.

Reasoning

HumanEval+

86.1%Сам.

HellaSwag

80.1%Сам.

Safety

AttaQ

88.5%Сам.

Индексы оценки AA

Math Index

6.7

Intelligence Index

1.8

Math 500

0.7

Mmlu Pro

0.5

Gpqa

0.3

Ifbench

0.2

Livecodebench

0.1

Tau2

0.1

Scicode

0.1

Aime 25

0.1

Aime

0.0

Lcr

0.0

Hle

0.0

Terminalbench Hard

0.0

Оценки категорий LLM Stats

Safety

Code

Instruction Following

Language

Structured Output

Legal

Math

Reasoning

Finance

General

Healthcare

Creativity

Writing

Цены

Цена ввода$0.03 / 1M токенов

Цена вывода$0.25 / 1M токенов

Смешанная цена (3:1)$0.085 / 1M токенов

Скорость

Токенов/сек369.4

Задержка первого токена21.86s

Время до первого ответа21.86s

Рейтинг цен провайдеров

1 провайдеров

ПровайдерВводВывод

1IBMОсновной

$0.03

$0.25

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis