NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)

NVIDIA

Description

Nemotron 3 Nano is a 31.6B hybrid MoE model optimized for fast, long‑context agentic reasoning. It mixes Mamba‑2 and Transformer layers with a sparse MoE router (~3.6B active params per token) to deliver up to 4× higher throughput than Nemotron 2 and strong accuracy across math, coding, and tools. It supports a 1M‑token context window, offers Reasoning ON/OFF and a thinking‑budget to control costs, and ships with open weights, data, and RL tooling (NeMo Gym/RL). Released Dec 15, 2025 under the NVIDIA Open Model License, it’s built as the efficient backbone for multi‑agent systems at scale.

Date de sortie

2025-12-15

Paramètres

—

Longueur du contexte

131K

Modalités

text

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement codage	191	49.0	AA
Classement général	167	54.0	AA
Raisonnement mathématique	29	92.0	AA
Science	202	48.0	AA

Scores de benchmarks (LLM Stats)

Agents

Terminal-Bench

8.5%Aut.

Biology

GPQA

75.0%Aut.

SciCode

33.3%Aut.

Code

SWE-Bench Verified

38.8%Aut.

Communication

Tau2 Retail

56.9%Aut.

Tau2 Airline

48.0%Aut.

Tau2 Telecom

42.2%Aut.

Multi-Challenge

38.5%Aut.

Creativity

Arena-Hard v2

67.7%Aut.

Finance

MMLU-Pro

78.3%Aut.

MMLU-ProX

59.5%Aut.

General

LiveCodeBench v6

68.3%Aut.

Language

WMT24++

86.2%Aut.

Math

AIME 2025

99.2%Aut.

Humanity's Last Exam

15.5%Aut.

Indices d'évaluation AA

Math Index

91.0

Intelligence Index

17.5

Aime 25

0.9

Mmlu Pro

0.8

Gpqa

0.8

Livecodebench

0.7

Ifbench

0.7

Tau2

0.4

Lcr

0.3

Scicode

0.3

Terminalbench Hard

0.1

Hle

0.1

Scores par catégorie LLM Stats

Language

Legal

Finance

General

Healthcare

Creativity

Writing

Math

Physics

Reasoning

Biology

Chemistry

Communication

Tool Calling

Frontend Development

Code

Vision

Agents

Tarification

Prix d'entrée$0.055 / 1M tokens

Prix de sortie$0.22 / 1M tokens

Prix mixte (3:1)$0.096 / 1M tokens

Vitesse

Tokens/sec98.2

Délai du premier token2.46s

Temps de réponse22.83s

Classement des Prix par Fournisseur

3 fournisseurs

Moins cher: NVIDIAPlus cher: Venice AI

FournisseurEntréeSortie

1NVIDIAPRINCIPAL

$0.055

$0.22

2Nebius Token Factory

$0.06

$0.24

3Venice AI

$0.075

$0.3

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

Artificial Analysis