メインコンテンツへスキップ

Hermes 4 - Llama-3.1 70B (Reasoning)

Nous ResearchLlama
リリース日
2025-08-27
パラメータ
コンテキスト長
131K
モダリティ
text

能力レーダー

31
general
58
coding
69
reasoning
45
science推定
80
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
コーディングランキング298
29.0
AA
総合ランキング316
34.0
AA
数学的推論121
69.0
AA
科学212
47.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA50.5%自己申告

Code

HumanEval88.4%自己申告

Finance

MMLU86.0%自己申告
MMLU-Pro68.9%自己申告

General

IFEval92.1%自己申告
MBPP EvalPlus87.6%自己申告
BFCL v277.3%自己申告

Math

MGSM91.1%自己申告
MATH77.0%自己申告

AA評価指数

Math Index
68.7
Intelligence Index
10.0
Mmlu Pro
0.8
Gpqa
0.7
Aime 25
0.7
Livecodebench
0.7
Scicode
0.3
Ifbench
0.3
Tau2
0.2
Hle
0.1
Lcr
0.1
Terminalbench Hard
0.0

LLM Statsカテゴリスコア

Structured Output
90
Instruction Following
90
Code
90
Math
80
Reasoning
80
Language
80
Legal
80
Finance
80
Healthcare
80
Tool Calling
80
General
70
Physics
50
Biology
50
Chemistry
50

価格設定

入力価格$0.13 / 1Mトークン
出力価格$0.4 / 1Mトークン
混合価格(3:1)$0.198 / 1Mトークン

速度

トークン/秒89.6
初トークン遅延0.62s
初回答遅延22.93s

プロバイダー価格ランキング

プロバイダー価格ランキング

1 プロバイダー

プロバイダー入力出力
1Nous Researchプライマリ
$0.13
$0.4

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク