Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)
NVIDIALlamaオープンウエイトLlama 3.1 Community License
説明
A 253B parameter derivative of Meta Llama 3.1 405B Instruct, developed by NVIDIA using Neural Architecture Search (NAS) and vertical compression. It underwent multi-phase post-training (SFT for Math, Code, Reasoning, Chat, Tool Calling; RL with GRPO) to enhance reasoning and instruction-following. Optimized for accuracy/efficiency tradeoff on NVIDIA GPUs. Supports 128k context.
リリース日
2025-04-07
パラメータ
253.0B
コンテキスト長
—
モダリティ
—
能力レーダー
31
general
58
coding
72
reasoning
47
science推定
70
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 307 | 28.0 | AA |
| 総合ランキング | 314 | 34.0 | AA |
| 数学的推論 | 108 | 73.0 | AA |
| 科学 | 192 | 49.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
76.0%自己申告
Code
LiveCodeBench
66.3%自己申告
General
IFEval
89.5%自己申告
BFCL v2
74.1%自己申告
Math
MATH-500
97.0%自己申告
AIME 2025
72.5%自己申告
AA評価指数
Math Index63.7
Intelligence Index9.1
Math 5001.0
Mmlu Pro0.8
Aime0.7
Gpqa0.7
Livecodebench0.6
Aime 250.6
Ifbench0.4
Scicode0.3
Tau20.1
Hle0.1
Lcr0.1
Terminalbench Hard0.0
LLM Statsカテゴリスコア
Instruction Following90
Structured Output90
Math80
Physics80
Reasoning80
General80
Biology80
Chemistry80
Code70
Tool Calling70
価格設定
入力価格$0.6 / 1Mトークン
出力価格$1.8 / 1Mトークン
混合価格(3:1)$0.9 / 1Mトークン
速度
トークン/秒52.2
初トークン遅延0.70s
初回答遅延39.03s
プロバイダー価格ランキング
プロバイダー価格ランキング
3 プロバイダー
最安: NVIDIA最高: LLM Gateway
プロバイダー入力出力
1NVIDIAプライマリ
$0.6
$1.8
2Nebius Token Factory
$0.6
$1.8
3LLM Gateway
$0.6
$1.8
このモデルの異なるAPIプロバイダー間の価格を比較。