NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)
Descripción
Nemotron 3 Nano is a 31.6B hybrid MoE model optimized for fast, long‑context agentic reasoning. It mixes Mamba‑2 and Transformer layers with a sparse MoE router (~3.6B active params per token) to deliver up to 4× higher throughput than Nemotron 2 and strong accuracy across math, coding, and tools. It supports a 1M‑token context window, offers Reasoning ON/OFF and a thinking‑budget to control costs, and ships with open weights, data, and RL tooling (NeMo Gym/RL). Released Dec 15, 2025 under the NVIDIA Open Model License, it’s built as the efficient backbone for multi‑agent systems at scale.
Radar de capacidades
Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.
Rankings
| Dominio | #Posición | Puntuación | Fuente |
|---|---|---|---|
| Capacidad agéntica | 124 | 9.0 | LS |
| Ranking de codificación | 348 | 22.0 | AA |
| Ranking general | 379 | 29.0 | AA |
| Razonamiento matemático | 329 | 13.0 | AA |
| Ciencia | 396 | 27.0 | AA |
Puntuaciones de benchmarks (LLM Stats)
Agents
Biology
Code
Communication
Creativity
Finance
General
Language
Math
Índices de evaluación AA
Puntuaciones por categoría LLM Stats
Precios
Velocidad
Ranking de Precios por Proveedor
Ranking de Precios por Proveedor
6 proveedores
Comparar precios entre diferentes proveedores de API para este modelo.