Перейти к основному содержанию

NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

NVIDIAОткрытые весаNVIDIA Open Model License Agreement · Коммерческое использование

Описание

Nemotron 3 Nano is a 31.6B hybrid MoE model optimized for fast, long‑context agentic reasoning. It mixes Mamba‑2 and Transformer layers with a sparse MoE router (~3.6B active params per token) to deliver up to 4× higher throughput than Nemotron 2 and strong accuracy across math, coding, and tools. It supports a 1M‑token context window, offers Reasoning ON/OFF and a thinking‑budget to control costs, and ships with open weights, data, and RL tooling (NeMo Gym/RL). Released Dec 15, 2025 under the NVIDIA Open Model License, it’s built as the efficient backbone for multi‑agent systems at scale.

Дата выхода
2025-12-15
Параметры
32.0B
Длина контекста
131K
Модальности
text

Радар способностей

22
general
33
coding
18
reasoning
27
scienceоцен.
50
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Оценки бенчмарков (LLM Stats)

Agents

Terminal-Bench8.5%Сам.

Biology

GPQA75.0%Сам.
SciCode33.3%Сам.

Code

SWE-Bench Verified38.8%Сам.

Communication

Tau2 Retail56.9%Сам.
Tau2 Airline48.0%Сам.
Tau2 Telecom42.2%Сам.
Multi-Challenge38.5%Сам.

Creativity

Arena-Hard v267.7%Сам.

Finance

MMLU-Pro78.3%Сам.
MMLU-ProX59.5%Сам.

General

LiveCodeBench v668.3%Сам.

Language

WMT24++86.2%Сам.

Math

AIME 202599.2%Сам.
Humanity's Last Exam15.5%Сам.

Индексы оценки AA

Math Index
13.3
Intelligence Index
7.4
Mmlu Pro
0.6
Gpqa
0.4
Ifbench
0.4
Livecodebench
0.4
Tau2
0.3
Scicode
0.2
Aime 25
0.1
Terminalbench Hard
0.1
Lcr
0.1
Hle
0.0

Оценки категорий LLM Stats

Language
70
Legal
70
Finance
70
General
70
Healthcare
70
Creativity
70
Writing
70
Math
60
Physics
50
Reasoning
50
Biology
50
Chemistry
50
Communication
50
Tool Calling
50
Frontend Development
40
Code
30
Vision
20
Agents
10

Цены

Цена ввода$0.05 / 1M токенов
Цена вывода$0.2 / 1M токенов
Смешанная цена (3:1)$0.088 / 1M токенов

Скорость

Токенов/сек96.6
Задержка первого токена0.27s
Время до первого ответа0.27s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

6 провайдеров

Самый дешевый: DeepInfraСамый дорогой: NanoGPT
ПровайдерВводВывод
1DeepInfraСамый дешевый
$0
$0
2NVIDIAОсновной
$0.05
$0.2
3OpenRouter
$0.05
$0.2
4Kilo Gateway
$0.05
$0.2
5Vercel AI Gateway
$0.05
$0.24
6NanoGPT
$0.17
$0.68

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки