MiniCPM-SALA

OpenBMBOpen WeightApache 2.0 · Commercial OK

説明

MiniCPM-SALA (Sparse Attention and Linear Attention) is a 9B hybrid model built from a MiniCPM-4.0 checkpoint via continual training (~2T tokens, 25% of training-from-scratch cost). It interleaves 25% InfLLM-V2 sparse attention and 75% Lightning Attention layers, achieving up to 3.5x inference speed over dense baselines at 256K tokens. With HyPE (Hybrid Positional Encoding) and NoPE in sparse layers, the model extrapolates to 2048K tokens despite a 520K training length, enabling 1M-token inference on consumer GPUs like the RTX 5090.

リリース日

2026-02-11

パラメータ

9.5B

コンテキスト長

—

モダリティ

—

能力レーダー

general

100

coding

reasoning

science推定

agents

multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ベンチマークスコア (LLM Stats)

Code

HumanEval

95.1%自己申告

Finance

MMLU-Pro

67.0%自己申告

General

MBPP

0.89 / 100自己申告

CMMLU

81.5%自己申告

IFEval

76.3%自己申告

LiveCodeBench v5

60.5%自己申告

LiveCodeBench v6

52.0%自己申告

MRCR 64K (2-needle)

29.8%自己申告

MRCR 128K (2-needle)

28.6%自己申告

MRCR 64K (4-needle)

20.6%自己申告

MRCR 128K (4-needle)

19.6%自己申告

MRCR 64K (8-needle)

16.6%自己申告

MRCR 128K (8-needle)

10.1%自己申告

Language

BBH

81.5%自己申告

Long Context

RULER 64k

92.7%自己申告

RULER 128k

89.4%自己申告

RULER 512K

87.1%自己申告

RULER 1000K

86.3%自己申告

RULER 2048K

81.6%自己申告

NoLiMa 32K

54.5%自己申告

NoLiMa 64K

43.0%自己申告

NoLiMa 128K

23.9%自己申告

Math

AIME 2024

83.8%自己申告

AIME 2025

78.3%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Code

100

Structured Output

Instruction Following

Language

Math

Reasoning

Finance

General

Healthcare

Legal

価格設定

価格データがありません

速度

速度データがありません

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク

LLM Stats

説明

能力レーダー

ランキング

ベンチマークスコア (LLM Stats)

Code

Finance

General

Language

Long Context

Math

AA評価指数

LLM Statsカテゴリスコア

価格設定

速度

利用可能なプロバイダー

外部リンク