メインコンテンツへスキップ

Nemotron 3 Ultra (550B A55B)

NVIDIAオープンウエイトOpenMDW License v1.1 · 商用利用可

説明

Nemotron 3 Ultra is NVIDIA's frontier-scale open model with 550B total / 55B active parameters, built for agentic reasoning, long-context analysis, tool use, and high-stakes RAG. It uses a hybrid Latent Mixture-of-Experts (LatentMoE) architecture interleaving Mamba-2, MoE, and select Attention layers, with Multi-Token Prediction (MTP) for native speculative decoding, and is pre-trained on ~20T tokens with an NVFP4 recipe. Reasoning is configurable on/off (plus a medium-effort mode) via the chat template. It supports up to a 1M-token context and 10 languages (English, French, Spanish, Italian, German, Japanese, Hindi, Korean, Brazilian Portuguese, Chinese). Released with open weights, training data, and recipes under the OpenMDW-1.1 license.

リリース日
2026-06-04
パラメータ
550.0B
コンテキスト長
1.0M
モダリティ
text

能力レーダー

100
general
60
coding
60
reasoning
60
science推定
40
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
エージェント能力93
48.0
LS
推論21
85.0
LS

ベンチマークスコア (LLM Stats)

Agents

GDPval-AA1183.00 / 3000自己申告
PinchBench90.0%自己申告
Terminal-Bench 2.156.4%自己申告
ProfBench56.0%自己申告
Finance Agent53.7%自己申告
GDPval46.7%自己申告
BrowseComp44.4%自己申告
Finance Agent v237.5%自己申告
TAU3-Bench22.6%自己申告

Biology

GPQA87.0%自己申告
SciCode44.6%自己申告

Code

SWE-Bench Verified70.7%自己申告
SWE-bench Multilingual67.7%自己申告

Communication

Multi-Challenge63.8%自己申告

Finance

MMLU-Pro86.8%自己申告
MMLU-ProX83.0%自己申告

General

LiveCodeBench v689.0%自己申告
IFBench81.7%自己申告
LongBench v261.9%自己申告

Knowledge

OmniScience78.7%自己申告

Language

WMT24++83.7%自己申告

Long Context

RULER94.7%自己申告
AA-LCR65.4%自己申告

Math

IMO-AnswerBench92.3%自己申告
Humanity's Last Exam37.4%自己申告
CritPT3.1%自己申告

Reasoning

Apex84.8%自己申告

AA評価指数

AA評価データがありません

LLM Statsカテゴリスコア

Legal
100
Finance
100
General
100
Agents
100
Reasoning
60
Coding
90
Instruction Following
80
Language
80
Healthcare
80
Long Context
70
Physics
70
Frontend Development
70
Biology
70
Chemistry
70
Structured Output
60
Math
60
Code
60
Communication
60
Search
40
Tool Calling
40
Vision
40

価格設定

入力価格$0.5 / 1Mトークン
出力価格$2.5 / 1Mトークン
混合価格(3:1)$1 / 1Mトークン
キャッシュ読み取り価格$0.15 / 1Mトークン

速度

速度データがありません

プロバイダー価格ランキング

プロバイダー価格ランキング

4 プロバイダー

最安: NVIDIA最高: Together AI
プロバイダー入力出力
1NVIDIAプライマリ
$0.5
$2.5
2OpenRouter
$0.5
$2.2
3Vercel AI Gateway
$0.6
$2.4
4Together AI
$0.6
$3.6

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク