Saltar al contenido principal

Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

NVIDIALlamaOpen WeightLlama 3.1 Community License

Descripción

A 253B parameter derivative of Meta Llama 3.1 405B Instruct, developed by NVIDIA using Neural Architecture Search (NAS) and vertical compression. It underwent multi-phase post-training (SFT for Math, Code, Reasoning, Chat, Tool Calling; RL with GRPO) to enhance reasoning and instruction-following. Optimized for accuracy/efficiency tradeoff on NVIDIA GPUs. Supports 128k context.

Fecha de lanzamiento
2025-04-07
Parámetros
253.0B
Longitud del contexto
Modalidades

Radar de capacidades

34
general
33
coding
72
reasoning
47
scienceest.
70
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Code Ranking290
26.0
AA
General Ranking298
36.0
AA
Math Reasoning108
73.0
AA
Science177
50.0
AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA76.0%Aut.

Code

LiveCodeBench66.3%Aut.

General

IFEval89.5%Aut.
BFCL v274.1%Aut.

Math

MATH-50097.0%Aut.
AIME 202572.5%Aut.

Índices de evaluación AA

Math Index
63.7
Intelligence Index
15.0
Coding Index
13.1
Math 500
1.0
Mmlu Pro
0.8
Aime
0.7
Gpqa
0.7
Livecodebench
0.6
Aime 25
0.6
Ifbench
0.4
Scicode
0.3
Tau2
0.1
Hle
0.1
Lcr
0.1
Terminalbench Hard
0.0

Puntuaciones por categoría LLM Stats

Structured Output
90
Instruction Following
90
Biology
80
Chemistry
80
General
80
Math
80
Physics
80
Reasoning
80
Tool Calling
70
Code
70

Precios

Precio de entrada$0.6 / 1M tokens
Precio de salida$1.8 / 1M tokens
Precio mixto (3:1)$0.9 / 1M tokens

Velocidad

Tokens/seg40.9 tokens/s
Retraso del primer token0.75s
Tiempo hasta la respuesta49.64s

Proveedores disponibles

(Unidades internas LS)

No hay datos de proveedores disponibles

Fuentes externas