メインコンテンツへスキップ

Granite 3.3 8B (Non-reasoning)

IBMOpen WeightApache 2.0 · Commercial OK

説明

Granite-3.3-8B-Base is a decoder-only language model with a 128K token context window. It improves upon Granite-3.1-8B-Base by adding support for Fill-in-the-Middle (FIM) using specialized tokens, enabling the model to generate content conditioned on both prefix and suffix. This makes it well-suited for code completion tasks

リリース日
2025-04-16
パラメータ
8.2B
コンテキスト長
モダリティ
text

能力レーダー

19
general
7
coding
18
reasoning
20
science推定
0
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking449
6.0
AA
General Ranking455
17.0
AA
Math Reasoning314
18.0
AA
Reasoning24
83.0
LS
Science439
17.0
AA

ベンチマークスコア (LLM Stats)

Code

HumanEval89.7%自己申告

Creativity

AlpacaEval 2.062.7%自己申告
Arena Hard57.6%自己申告

Finance

MMLU63.9%自己申告
TruthfulQA52.1%自己申告

General

TriviaQA78.2%自己申告
IFEval74.8%自己申告
ARC-C50.8%自己申告
AGIEval49.3%自己申告
NQ36.5%自己申告
PopQA26.2%自己申告

Language

Winogrande74.4%自己申告
BIG-Bench Hard69.1%自己申告

Math

AIME 202481.2%自己申告
MATH-50069.0%自己申告
GSM8k59.0%自己申告
DROP36.1%自己申告

Reasoning

HumanEval+86.1%自己申告
HellaSwag80.1%自己申告

Safety

AttaQ88.5%自己申告

AA評価指数

Intelligence Index
7.0
Math Index
6.7
Coding Index
3.4
Math 500
0.7
Mmlu Pro
0.5
Gpqa
0.3
Ifbench
0.2
Livecodebench
0.1
Tau2
0.1
Scicode
0.1
Aime 25
0.1
Aime
0.0
Lcr
0.0
Hle
0.0
Terminalbench Hard
0.0

LLM Statsカテゴリスコア

Code
90
Safety
90
Structured Output
70
Instruction Following
70
Language
70
Writing
60
Creativity
60
Finance
60
General
60
Healthcare
60
Legal
60
Math
60
Reasoning
60

価格設定

入力価格$0.03 / 1M tokens
出力価格$0.25 / 1M tokens
混合価格(3:1)$0.085 / 1M tokens

速度

トークン/秒308.3 tokens/s
初トークン遅延21.55s
初回答遅延21.55s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク