メインコンテンツへスキップ

NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

NVIDIAオープンウエイトNVIDIA Open Model License Agreement · 商用利用可

説明

Nemotron 3 Super is a 120B total / 12B active parameter hybrid Mamba-Attention Mixture-of-Experts model optimized for agentic reasoning, coding, planning, tool calling, and long-context analysis. It introduces LatentMoE (projecting tokens into a compressed latent space for expert routing, enabling 4x more experts at the same inference cost), Multi-Token Prediction for native speculative decoding (up to 3x faster generation), and native NVFP4 pretraining on Blackwell. The hybrid architecture interleaves Mamba-2 layers for linear-time sequence processing with strategically placed Transformer attention layers as global anchors, supporting a 1M-token context window. Pre-trained on 25 trillion tokens and post-trained with multi-environment RL across 21 configurations using NeMo Gym/RL with 1.2 million rollouts. Achieves up to 5x higher throughput than previous Nemotron Super and 2.2x higher throughput than GPT-OSS-120B while maintaining comparable accuracy.

リリース日
2026-03-11
パラメータ
120.0B
コンテキスト長
262K
モダリティ
text

能力レーダー

24
general
37
coding
80
reasoning
52
science推定
50
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
エージェント能力117
30.0
LS
コーディングランキング148
56.0
AA
総合ランキング137
58.0
AA
推論97
42.0
LS
科学112
59.0
AA

ベンチマークスコア (LLM Stats)

Agents

BrowseComp31.3%自己申告
Terminal-Bench 2.031.0%自己申告
Terminal-Bench25.8%自己申告

Biology

GPQA82.7%自己申告
SciCode42.0%自己申告

Code

LiveCodeBench81.2%自己申告
SWE-Bench Verified53.7%自己申告
SWE-bench Multilingual45.8%自己申告

Communication

Tau2 Telecom64.4%自己申告
Tau2 Retail62.8%自己申告
Tau2 Airline56.3%自己申告
Multi-Challenge55.2%自己申告

Creativity

Arena-Hard v273.9%自己申告

Finance

MMLU-Pro83.7%自己申告
MMLU-ProX79.4%自己申告

General

IFBench72.6%自己申告

Language

WMT24++86.7%自己申告

Long Context

RULER91.8%自己申告
AA-LCR58.3%自己申告

Math

HMMT 202594.7%自己申告
AIME 202590.2%自己申告
Humanity's Last Exam22.8%自己申告

Reasoning

Bird-SQL (dev)41.8%自己申告

AA評価指数

Coding Index
37.7
Intelligence Index
25.4
Gpqa
0.8
Ifbench
0.7
Tau2
0.7
Lcr
0.6
Terminalbench V2 1
0.4
Scicode
0.4
Terminalbench Hard
0.3
Hle
0.2
Tau Banking
0.1

LLM Statsカテゴリスコア

Language
80
Legal
80
Long Context
80
Finance
80
General
80
Healthcare
80
Instruction Following
70
Math
70
Creativity
70
Writing
70
Physics
60
Reasoning
60
Biology
60
Chemistry
60
Communication
60
Frontend Development
50
Code
50
Tool Calling
50
Search
30
Agents
30
Vision
20

価格設定

入力価格$0.3 / 1Mトークン
出力価格$0.75 / 1Mトークン
混合価格(3:1)$0.412 / 1Mトークン

速度

トークン/秒243.2
初トークン遅延1.04s
初回答遅延9.27s

プロバイダー価格ランキング

プロバイダー価格ランキング

10 プロバイダー

最安: NanoGPT最高: DigitalOcean
プロバイダー入力出力
1NanoGPT最安
$0.05
$0.25
2Amazon Bedrock
$0.15
$0.65
3Vercel AI Gateway
$0.15
$0.65
4Nvidia
$0.2
$0.8
5Weights & Biases
$0.2
$0.8
6Perplexity Agent
$0.25
$2.5
7Cortecs
$0.266
$0.799
8Nebius Token Factory
$0.3
$0.9
9Synthetic
$0.3
$1
10DigitalOcean
$0.3
$0.65

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク