Nemotron 3 Ultra (550B A55B)
설명
Nemotron 3 Ultra is NVIDIA's frontier-scale open model with 550B total / 55B active parameters, built for agentic reasoning, long-context analysis, tool use, and high-stakes RAG. It uses a hybrid Latent Mixture-of-Experts (LatentMoE) architecture interleaving Mamba-2, MoE, and select Attention layers, with Multi-Token Prediction (MTP) for native speculative decoding, and is pre-trained on ~20T tokens with an NVFP4 recipe. Reasoning is configurable on/off (plus a medium-effort mode) via the chat template. It supports up to a 1M-token context and 10 languages (English, French, Spanish, Italian, German, Japanese, Hindi, Korean, Brazilian Portuguese, Chinese). Released with open weights, training data, and recipes under the OpenMDW-1.1 license.
능력 레이더
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
벤치마크 점수 (LLM Stats)
Agents
Biology
Code
Communication
Finance
General
Knowledge
Language
Long Context
Math
Reasoning
AA 평가 지수
AA 평가 데이터가 없습니다
LLM Stats 카테고리 점수
가격
속도
속도 데이터가 없습니다
공급자 가격 순위
공급자 가격 순위
4개 공급자
이 모델의 다양한 API 공급자 간 가격 비교.