NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)
NVIDIAOpen WeightNVIDIA Open Model License Agreement · Commercial OK
説明
Nemotron 3 Nano is a 31.6B hybrid MoE model optimized for fast, long‑context agentic reasoning. It mixes Mamba‑2 and Transformer layers with a sparse MoE router (~3.6B active params per token) to deliver up to 4× higher throughput than Nemotron 2 and strong accuracy across math, coding, and tools. It supports a 1M‑token context window, offers Reasoning ON/OFF and a thinking‑budget to control costs, and ships with open weights, data, and RL tooling (NeMo Gym/RL). Released Dec 15, 2025 under the NVIDIA Open Model License, it’s built as the efficient backbone for multi‑agent systems at scale.
リリース日
2025-12-15
パラメータ
32.0B
コンテキスト長
262K
モダリティ
text
能力レーダー
25
general
24
coding
18
reasoning
27
science推定
50
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Agents & Tools | 101 | 9.0 | LS |
| Code Ranking | 307 | 24.0 | AA |
| General Ranking | 356 | 31.0 | AA |
| Math Reasoning | 329 | 13.0 | AA |
| Science | 371 | 28.0 | AA |
ベンチマークスコア (LLM Stats)
Agents
Terminal-Bench
8.5%自己申告
Biology
GPQA
75.0%自己申告
SciCode
33.3%自己申告
Code
SWE-Bench Verified
38.8%自己申告
Communication
Tau2 Retail
56.9%自己申告
Tau2 Airline
48.0%自己申告
Tau2 Telecom
42.2%自己申告
Multi-Challenge
38.5%自己申告
Creativity
Arena-Hard v2
67.7%自己申告
Finance
MMLU-Pro
78.3%自己申告
MMLU-ProX
59.5%自己申告
General
LiveCodeBench v6
68.3%自己申告
Language
WMT24++
86.2%自己申告
Math
AIME 2025
99.2%自己申告
Humanity's Last Exam
15.5%自己申告
AA評価指数
Coding Index15.8
Math Index13.3
Intelligence Index13.2
Mmlu Pro0.6
Gpqa0.4
Ifbench0.4
Livecodebench0.4
Tau20.3
Scicode0.2
Aime 250.1
Terminalbench Hard0.1
Lcr0.1
Hle0.0
LLM Statsカテゴリスコア
Writing70
Creativity70
Finance70
General70
Healthcare70
Language70
Legal70
Math60
Tool Calling50
Biology50
Chemistry50
Communication50
Physics50
Reasoning50
Frontend Development40
Code30
Vision20
Agents10
価格設定
入力価格$0.05 / 1M tokens
出力価格$0.2 / 1M tokens
混合価格(3:1)$0.088 / 1M tokens
速度
トークン/秒78.5 tokens/s
初トークン遅延0.25s
初回答遅延0.25s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| DeepInfra | 60K | 240K |