メインコンテンツへスキップ

NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

NVIDIAOpen WeightNVIDIA Open Model License Agreement · Commercial OK

説明

Nemotron 3 Nano is a 31.6B hybrid MoE model optimized for fast, long‑context agentic reasoning. It mixes Mamba‑2 and Transformer layers with a sparse MoE router (~3.6B active params per token) to deliver up to 4× higher throughput than Nemotron 2 and strong accuracy across math, coding, and tools. It supports a 1M‑token context window, offers Reasoning ON/OFF and a thinking‑budget to control costs, and ships with open weights, data, and RL tooling (NeMo Gym/RL). Released Dec 15, 2025 under the NVIDIA Open Model License, it’s built as the efficient backbone for multi‑agent systems at scale.

リリース日
2025-12-15
パラメータ
32.0B
コンテキスト長
262K
モダリティ
text

能力レーダー

25
general
24
coding
18
reasoning
27
science推定
50
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Agents & Tools101
9.0
LS
Code Ranking307
24.0
AA
General Ranking356
31.0
AA
Math Reasoning329
13.0
AA
Science371
28.0
AA

ベンチマークスコア (LLM Stats)

Agents

Terminal-Bench8.5%自己申告

Biology

GPQA75.0%自己申告
SciCode33.3%自己申告

Code

SWE-Bench Verified38.8%自己申告

Communication

Tau2 Retail56.9%自己申告
Tau2 Airline48.0%自己申告
Tau2 Telecom42.2%自己申告
Multi-Challenge38.5%自己申告

Creativity

Arena-Hard v267.7%自己申告

Finance

MMLU-Pro78.3%自己申告
MMLU-ProX59.5%自己申告

General

LiveCodeBench v668.3%自己申告

Language

WMT24++86.2%自己申告

Math

AIME 202599.2%自己申告
Humanity's Last Exam15.5%自己申告

AA評価指数

Coding Index
15.8
Math Index
13.3
Intelligence Index
13.2
Mmlu Pro
0.6
Gpqa
0.4
Ifbench
0.4
Livecodebench
0.4
Tau2
0.3
Scicode
0.2
Aime 25
0.1
Terminalbench Hard
0.1
Lcr
0.1
Hle
0.0

LLM Statsカテゴリスコア

Writing
70
Creativity
70
Finance
70
General
70
Healthcare
70
Language
70
Legal
70
Math
60
Tool Calling
50
Biology
50
Chemistry
50
Communication
50
Physics
50
Reasoning
50
Frontend Development
40
Code
30
Vision
20
Agents
10

価格設定

入力価格$0.05 / 1M tokens
出力価格$0.2 / 1M tokens
混合価格(3:1)$0.088 / 1M tokens

速度

トークン/秒78.5 tokens/s
初トークン遅延0.25s
初回答遅延0.25s

利用可能なプロバイダー

(LS内部単位)
プロバイダー入力価格出力価格
DeepInfra60K240K

外部リンク