Nemotron 3 Ultra (550B A55B)
Description
Nemotron 3 Ultra is NVIDIA's frontier-scale open model with 550B total / 55B active parameters, built for agentic reasoning, long-context analysis, tool use, and high-stakes RAG. It uses a hybrid Latent Mixture-of-Experts (LatentMoE) architecture interleaving Mamba-2, MoE, and select Attention layers, with Multi-Token Prediction (MTP) for native speculative decoding, and is pre-trained on ~20T tokens with an NVFP4 recipe. Reasoning is configurable on/off (plus a medium-effort mode) via the chat template. It supports up to a 1M-token context and 10 languages (English, French, Spanish, Italian, German, Japanese, Hindi, Korean, Brazilian Portuguese, Chinese). Released with open weights, training data, and recipes under the OpenMDW-1.1 license.
Radar de capacités
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Capacité agentique | 93 | 48.0 | LS |
| Raisonnement | 21 | 85.0 | LS |
Scores de benchmarks (LLM Stats)
Agents
Biology
Code
Communication
Finance
General
Knowledge
Language
Long Context
Math
Reasoning
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Tarification
Vitesse
Aucune donnée de vitesse disponible
Classement des Prix par Fournisseur
Classement des Prix par Fournisseur
4 fournisseurs
Comparer les prix entre différents fournisseurs API pour ce modèle.