Saltar al contenido principal

Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

NVIDIALlamaOpen WeightLlama 3.1 Community License

Descripción

A 253B parameter derivative of Meta Llama 3.1 405B Instruct, developed by NVIDIA using Neural Architecture Search (NAS) and vertical compression. It underwent multi-phase post-training (SFT for Math, Code, Reasoning, Chat, Tool Calling; RL with GRPO) to enhance reasoning and instruction-following. Optimized for accuracy/efficiency tradeoff on NVIDIA GPUs. Supports 128k context.

Fecha de lanzamiento
2025-04-07
Parámetros
253.0B
Longitud del contexto
Modalidades

Radar de capacidades

31
general
58
coding
72
reasoning
47
scienceest.
70
agents
0
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Ranking de codificación307
28.0
AA
Ranking general314
34.0
AA
Razonamiento matemático108
73.0
AA
Ciencia192
49.0
AA

Puntuaciones de benchmarks (LLM Stats)

Biology

GPQA76.0%Aut.

Code

LiveCodeBench66.3%Aut.

General

IFEval89.5%Aut.
BFCL v274.1%Aut.

Math

MATH-50097.0%Aut.
AIME 202572.5%Aut.

Índices de evaluación AA

Math Index
63.7
Intelligence Index
9.1
Math 500
1.0
Mmlu Pro
0.8
Aime
0.7
Gpqa
0.7
Livecodebench
0.6
Aime 25
0.6
Ifbench
0.4
Scicode
0.3
Tau2
0.1
Hle
0.1
Lcr
0.1
Terminalbench Hard
0.0

Puntuaciones por categoría LLM Stats

Instruction Following
90
Structured Output
90
Math
80
Physics
80
Reasoning
80
General
80
Biology
80
Chemistry
80
Code
70
Tool Calling
70

Precios

Precio de entrada$0.6 / 1M tokens
Precio de salida$1.8 / 1M tokens
Precio mixto (3:1)$0.9 / 1M tokens

Velocidad

Tokens/seg52.2
Retraso del primer token0.70s
Tiempo hasta la respuesta39.03s

Ranking de Precios por Proveedor

Ranking de Precios por Proveedor

3 proveedores

Más barato: NVIDIAMás caro: LLM Gateway
ProveedorEntradaSalida
1NVIDIAPRINCIPAL
$0.6
$1.8
2Nebius Token Factory
$0.6
$1.8
3LLM Gateway
$0.6
$1.8

Comparar precios entre diferentes proveedores de API para este modelo.

Fuentes externas