메인 콘텐츠로 건너뛰기

Nemotron 3 Ultra (550B A55B)

NVIDIA오픈 웨이트OpenMDW License v1.1 · 상업적 사용 가능

설명

Nemotron 3 Ultra is NVIDIA's frontier-scale open model with 550B total / 55B active parameters, built for agentic reasoning, long-context analysis, tool use, and high-stakes RAG. It uses a hybrid Latent Mixture-of-Experts (LatentMoE) architecture interleaving Mamba-2, MoE, and select Attention layers, with Multi-Token Prediction (MTP) for native speculative decoding, and is pre-trained on ~20T tokens with an NVFP4 recipe. Reasoning is configurable on/off (plus a medium-effort mode) via the chat template. It supports up to a 1M-token context and 10 languages (English, French, Spanish, Italian, German, Japanese, Hindi, Korean, Brazilian Portuguese, Chinese). Released with open weights, training data, and recipes under the OpenMDW-1.1 license.

출시일
2026-06-04
파라미터
550.0B
컨텍스트 길이
1.0M
모달리티
text

능력 레이더

100
general
60
coding
60
reasoning
60
science추정
40
agents
0
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
에이전트형 역량93
48.0
LS
추론21
85.0
LS

벤치마크 점수 (LLM Stats)

Agents

GDPval-AA1183.00 / 3000자체 보고
PinchBench90.0%자체 보고
Terminal-Bench 2.156.4%자체 보고
ProfBench56.0%자체 보고
Finance Agent53.7%자체 보고
GDPval46.7%자체 보고
BrowseComp44.4%자체 보고
Finance Agent v237.5%자체 보고
TAU3-Bench22.6%자체 보고

Biology

GPQA87.0%자체 보고
SciCode44.6%자체 보고

Code

SWE-Bench Verified70.7%자체 보고
SWE-bench Multilingual67.7%자체 보고

Communication

Multi-Challenge63.8%자체 보고

Finance

MMLU-Pro86.8%자체 보고
MMLU-ProX83.0%자체 보고

General

LiveCodeBench v689.0%자체 보고
IFBench81.7%자체 보고
LongBench v261.9%자체 보고

Knowledge

OmniScience78.7%자체 보고

Language

WMT24++83.7%자체 보고

Long Context

RULER94.7%자체 보고
AA-LCR65.4%자체 보고

Math

IMO-AnswerBench92.3%자체 보고
Humanity's Last Exam37.4%자체 보고
CritPT3.1%자체 보고

Reasoning

Apex84.8%자체 보고

AA 평가 지수

AA 평가 데이터가 없습니다

LLM Stats 카테고리 점수

Legal
100
Finance
100
General
100
Agents
100
Reasoning
60
Coding
90
Instruction Following
80
Language
80
Healthcare
80
Long Context
70
Physics
70
Frontend Development
70
Biology
70
Chemistry
70
Structured Output
60
Math
60
Code
60
Communication
60
Search
40
Tool Calling
40
Vision
40

가격

입력 가격$0.5 / 1M 토큰
출력 가격$2.5 / 1M 토큰
혼합 가격 (3:1)$1 / 1M 토큰
캐시 읽기 가격$0.15 / 1M 토큰

속도

속도 데이터가 없습니다

공급자 가격 순위

공급자 가격 순위

4개 공급자

최저가: NVIDIA최고가: Together AI
공급자입력출력
1NVIDIA주요
$0.5
$2.5
2OpenRouter
$0.5
$2.5
3Vercel AI Gateway
$0.6
$2.4
4Together AI
$0.6
$3.6

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크