Granite 3.3 8B (Non-reasoning)
IBMOpen WeightApache 2.0 · Commercial OK
説明
Granite-3.3-8B-Base is a decoder-only language model with a 128K token context window. It improves upon Granite-3.1-8B-Base by adding support for Fill-in-the-Middle (FIM) using specialized tokens, enabling the model to generate content conditioned on both prefix and suffix. This makes it well-suited for code completion tasks
リリース日
2025-04-16
パラメータ
8.2B
コンテキスト長
—
モダリティ
text
能力レーダー
19
general
7
coding
18
reasoning
20
science推定
0
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 449 | 6.0 | AA |
| General Ranking | 455 | 17.0 | AA |
| Math Reasoning | 314 | 18.0 | AA |
| Reasoning | 24 | 83.0 | LS |
| Science | 439 | 17.0 | AA |
ベンチマークスコア (LLM Stats)
Code
HumanEval
89.7%自己申告
Creativity
AlpacaEval 2.0
62.7%自己申告
Arena Hard
57.6%自己申告
Finance
MMLU
63.9%自己申告
TruthfulQA
52.1%自己申告
General
TriviaQA
78.2%自己申告
IFEval
74.8%自己申告
ARC-C
50.8%自己申告
AGIEval
49.3%自己申告
NQ
36.5%自己申告
PopQA
26.2%自己申告
Language
Winogrande
74.4%自己申告
BIG-Bench Hard
69.1%自己申告
Math
AIME 2024
81.2%自己申告
MATH-500
69.0%自己申告
GSM8k
59.0%自己申告
DROP
36.1%自己申告
Reasoning
HumanEval+
86.1%自己申告
HellaSwag
80.1%自己申告
Safety
AttaQ
88.5%自己申告
AA評価指数
Intelligence Index7.0
Math Index6.7
Coding Index3.4
Math 5000.7
Mmlu Pro0.5
Gpqa0.3
Ifbench0.2
Livecodebench0.1
Tau20.1
Scicode0.1
Aime 250.1
Aime0.0
Lcr0.0
Hle0.0
Terminalbench Hard0.0
LLM Statsカテゴリスコア
Code90
Safety90
Structured Output70
Instruction Following70
Language70
Writing60
Creativity60
Finance60
General60
Healthcare60
Legal60
Math60
Reasoning60
価格設定
入力価格$0.03 / 1M tokens
出力価格$0.25 / 1M tokens
混合価格(3:1)$0.085 / 1M tokens
速度
トークン/秒308.3 tokens/s
初トークン遅延21.55s
初回答遅延21.55s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません