メインコンテンツへスキップ

Hermes 3 - Llama-3.1 70B

Nous ResearchLlamaOpen WeightApache 2.0 · Commercial OK

説明

Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.

リリース日
2024-08-15
パラメータ
70.0B
コンテキスト長
131K
モダリティ
text

能力レーダー

24
general
20
coding
25
reasoning
27
science推定
0
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
Code Ranking347
20.0
AA
General Ranking382
28.0
AA
Math Reasoning279
27.0
AA
Reasoning43
70.0
LS
Science381
27.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA66.1%自己申告

Communication

MT-Bench8.99 / 100自己申告

Finance

MMLU79.1%自己申告
TruthfulQA63.3%自己申告
MMLU-Pro47.2%自己申告

General

PIQA84.4%自己申告
ARC-E83.0%自己申告
IFBench81.2%自己申告
ARC-C65.5%自己申告
AGIEval56.2%自己申告
OpenBookQA49.4%自己申告

Language

BoolQ88.0%自己申告
Winogrande83.2%自己申告
BBH67.8%自己申告

Math

MATH20.8%自己申告

Reasoning

HellaSwag88.2%自己申告
MuSR50.7%自己申告

AA評価指数

Intelligence Index
10.6
Mmlu Pro
0.6
Math 500
0.5
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Hle
0.0
Aime
0.0

LLM Statsカテゴリスコア

Communication
9
Creativity
9
Roleplay
9
General
1
Reasoning
1
Instruction Following
80
Physics
80
Biology
70
Chemistry
70
Language
70
Finance
60
Healthcare
60
Legal
60
Math
50

価格設定

入力価格$0.3 / 1M tokens
出力価格$0.3 / 1M tokens
混合価格(3:1)$0.3 / 1M tokens

速度

トークン/秒30.6 tokens/s
初トークン遅延0.46s
初回答遅延0.46s

利用可能なプロバイダー

(LS内部単位)

プロバイダーデータがありません

外部リンク