Перейти к основному содержанию

Nemotron 3 Ultra (550B A55B)

NVIDIAОткрытые весаOpenMDW License v1.1 · Коммерческое использование

Описание

Nemotron 3 Ultra is NVIDIA's frontier-scale open model with 550B total / 55B active parameters, built for agentic reasoning, long-context analysis, tool use, and high-stakes RAG. It uses a hybrid Latent Mixture-of-Experts (LatentMoE) architecture interleaving Mamba-2, MoE, and select Attention layers, with Multi-Token Prediction (MTP) for native speculative decoding, and is pre-trained on ~20T tokens with an NVFP4 recipe. Reasoning is configurable on/off (plus a medium-effort mode) via the chat template. It supports up to a 1M-token context and 10 languages (English, French, Spanish, Italian, German, Japanese, Hindi, Korean, Brazilian Portuguese, Chinese). Released with open weights, training data, and recipes under the OpenMDW-1.1 license.

Дата выхода
2026-06-04
Параметры
550.0B
Длина контекста
1.0M
Модальности
text

Радар способностей

100
general
60
coding
60
reasoning
60
scienceоцен.
40
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Агентные возможности93
48.0
LS
Рассуждения21
85.0
LS

Оценки бенчмарков (LLM Stats)

Agents

GDPval-AA1183.00 / 3000Сам.
PinchBench90.0%Сам.
Terminal-Bench 2.156.4%Сам.
ProfBench56.0%Сам.
Finance Agent53.7%Сам.
GDPval46.7%Сам.
BrowseComp44.4%Сам.
Finance Agent v237.5%Сам.
TAU3-Bench22.6%Сам.

Biology

GPQA87.0%Сам.
SciCode44.6%Сам.

Code

SWE-Bench Verified70.7%Сам.
SWE-bench Multilingual67.7%Сам.

Communication

Multi-Challenge63.8%Сам.

Finance

MMLU-Pro86.8%Сам.
MMLU-ProX83.0%Сам.

General

LiveCodeBench v689.0%Сам.
IFBench81.7%Сам.
LongBench v261.9%Сам.

Knowledge

OmniScience78.7%Сам.

Language

WMT24++83.7%Сам.

Long Context

RULER94.7%Сам.
AA-LCR65.4%Сам.

Math

IMO-AnswerBench92.3%Сам.
Humanity's Last Exam37.4%Сам.
CritPT3.1%Сам.

Reasoning

Apex84.8%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Legal
100
Finance
100
General
100
Agents
100
Reasoning
60
Coding
90
Instruction Following
80
Language
80
Healthcare
80
Long Context
70
Physics
70
Frontend Development
70
Biology
70
Chemistry
70
Structured Output
60
Math
60
Code
60
Communication
60
Search
40
Tool Calling
40
Vision
40

Цены

Цена ввода$0.5 / 1M токенов
Цена вывода$2.5 / 1M токенов
Смешанная цена (3:1)$1 / 1M токенов
Цена чтения кэша$0.15 / 1M токенов

Скорость

Нет данных о скорости

Рейтинг цен провайдеров

Рейтинг цен провайдеров

4 провайдеров

Самый дешевый: NVIDIAСамый дорогой: Together AI
ПровайдерВводВывод
1NVIDIAОсновной
$0.5
$2.5
2OpenRouter
$0.5
$2.2
3Vercel AI Gateway
$0.6
$2.4
4Together AI
$0.6
$3.6

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки