メインコンテンツへスキップ

Hermes 3 - Llama-3.1 70B

Nous ResearchLlamaオープンウエイトApache 2.0 · 商用利用可

説明

Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.

リリース日
2024-08-15
パラメータ
70.0B
コンテキスト長
131K
モダリティ
text

能力レーダー

21
general
20
coding
25
reasoning
27
science推定
24
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
コーディングランキング371
20.0
AA
総合ランキング413
25.0
AA
数学的推論279
27.0
AA
推論48
70.0
LS
科学401
27.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA66.1%自己申告

Communication

MT-Bench8.99 / 100自己申告

Finance

MMLU79.1%自己申告
TruthfulQA63.3%自己申告
MMLU-Pro47.2%自己申告

General

PIQA84.4%自己申告
ARC-E83.0%自己申告
IFBench81.2%自己申告
ARC-C65.5%自己申告
AGIEval56.2%自己申告
OpenBookQA49.4%自己申告

Language

BoolQ88.0%自己申告
Winogrande83.2%自己申告
BBH67.8%自己申告

Math

MATH20.8%自己申告

Reasoning

HellaSwag88.2%自己申告
MuSR50.7%自己申告

AA評価指数

Intelligence Index
5.1
Mmlu Pro
0.6
Math 500
0.5
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Hle
0.0
Aime
0.0

LLM Statsカテゴリスコア

Roleplay
9
Communication
9
Creativity
9
General
1
Reasoning
1
Instruction Following
80
Physics
80
Language
70
Biology
70
Chemistry
70
Legal
60
Finance
60
Healthcare
60
Math
50

価格設定

入力価格$0.3 / 1Mトークン
出力価格$0.3 / 1Mトークン
混合価格(3:1)$0.3 / 1Mトークン

速度

トークン/秒30.1
初トークン遅延0.35s
初回答遅延0.35s

プロバイダー価格ランキング

プロバイダー価格ランキング

4 プロバイダー

最安: Nous Research最高: OpenRouter
プロバイダー入力出力
1Nous Researchプライマリ
$0.3
$0.3
2Kilo Gateway
$0.3
$0.3
3NanoGPT
$0.408
$0.408
4OpenRouter
$0.7
$0.7

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク