Hermes 4 - Llama-3.1 70B (Non-reasoning)
Nous ResearchLlama
リリース日
2025-08-27
パラメータ
—
コンテキスト長
131K
モダリティ
text
能力レーダー
24
general
27
coding
18
reasoning
33
science推定
80
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 437 | 11.0 | AA |
| 総合ランキング | 390 | 28.0 | AA |
| 数学的推論 | 334 | 11.0 | AA |
| 科学 | 344 | 33.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
50.5%自己申告
Code
HumanEval
88.4%自己申告
Finance
MMLU
86.0%自己申告
MMLU-Pro
68.9%自己申告
General
IFEval
92.1%自己申告
MBPP EvalPlus
87.6%自己申告
BFCL v2
77.3%自己申告
Math
MGSM
91.1%自己申告
MATH
77.0%自己申告
AA評価指数
Math Index11.3
Intelligence Index6.9
Mmlu Pro0.7
Gpqa0.5
Ifbench0.3
Scicode0.3
Livecodebench0.3
Tau20.2
Aime 250.1
Hle0.0
Lcr0.0
Terminalbench Hard0.0
LLM Statsカテゴリスコア
Structured Output90
Instruction Following90
Code90
Math80
Reasoning80
Language80
Legal80
Finance80
Healthcare80
Tool Calling80
General70
Physics50
Biology50
Chemistry50
価格設定
入力価格$0.13 / 1Mトークン
出力価格$0.4 / 1Mトークン
混合価格(3:1)$0.198 / 1Mトークン
速度
トークン/秒91.4
初トークン遅延0.62s
初回答遅延0.62s
プロバイダー価格ランキング
プロバイダー価格ランキング
2 プロバイダー
最安: Nous Research最高: NanoGPT
プロバイダー入力出力
1Nous Researchプライマリ
$0.13
$0.4
2NanoGPT
$0.25
$1.5
このモデルの異なるAPIプロバイダー間の価格を比較。