Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)
NVIDIALlamaOpen WeightLlama 3.1 Community License
説明
A 253B parameter derivative of Meta Llama 3.1 405B Instruct, developed by NVIDIA using Neural Architecture Search (NAS) and vertical compression. It underwent multi-phase post-training (SFT for Math, Code, Reasoning, Chat, Tool Calling; RL with GRPO) to enhance reasoning and instruction-following. Optimized for accuracy/efficiency tradeoff on NVIDIA GPUs. Supports 128k context.
リリース日
2025-04-07
パラメータ
253.0B
コンテキスト長
—
モダリティ
—
能力レーダー
34
general
33
coding
72
reasoning
47
science推定
70
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 290 | 26.0 | AA |
| General Ranking | 298 | 36.0 | AA |
| Math Reasoning | 108 | 73.0 | AA |
| Science | 177 | 50.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
76.0%自己申告
Code
LiveCodeBench
66.3%自己申告
General
IFEval
89.5%自己申告
BFCL v2
74.1%自己申告
Math
MATH-500
97.0%自己申告
AIME 2025
72.5%自己申告
AA評価指数
Math Index63.7
Intelligence Index15.0
Coding Index13.1
Math 5001.0
Mmlu Pro0.8
Aime0.7
Gpqa0.7
Livecodebench0.6
Aime 250.6
Ifbench0.4
Scicode0.3
Tau20.1
Hle0.1
Lcr0.1
Terminalbench Hard0.0
LLM Statsカテゴリスコア
Structured Output90
Instruction Following90
Biology80
Chemistry80
General80
Math80
Physics80
Reasoning80
Tool Calling70
Code70
価格設定
入力価格$0.6 / 1M tokens
出力価格$1.8 / 1M tokens
混合価格(3:1)$0.9 / 1M tokens
速度
トークン/秒40.9 tokens/s
初トークン遅延0.75s
初回答遅延49.64s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません