Nemotron 3 Ultra (550B A55B)
説明
Nemotron 3 Ultra is NVIDIA's frontier-scale open model with 550B total / 55B active parameters, built for agentic reasoning, long-context analysis, tool use, and high-stakes RAG. It uses a hybrid Latent Mixture-of-Experts (LatentMoE) architecture interleaving Mamba-2, MoE, and select Attention layers, with Multi-Token Prediction (MTP) for native speculative decoding, and is pre-trained on ~20T tokens with an NVFP4 recipe. Reasoning is configurable on/off (plus a medium-effort mode) via the chat template. It supports up to a 1M-token context and 10 languages (English, French, Spanish, Italian, German, Japanese, Hindi, Korean, Brazilian Portuguese, Chinese). Released with open weights, training data, and recipes under the OpenMDW-1.1 license.
能力レーダー
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
ベンチマークスコア (LLM Stats)
Agents
Biology
Code
Communication
Finance
General
Knowledge
Language
Long Context
Math
Reasoning
AA評価指数
AA評価データがありません
LLM Statsカテゴリスコア
価格設定
速度
速度データがありません
プロバイダー価格ランキング
プロバイダー価格ランキング
4 プロバイダー
このモデルの異なるAPIプロバイダー間の価格を比較。