跳轉到主要內容

Hermes 3 - Llama-3.1 70B

Nous ResearchLlama開源權重Apache 2.0 · 商用許可

描述

Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.

發布日期
2024-08-15
參數規模
70.0B
上下文長度
131K
支援模態
text

能力雷達圖

21
general
20
coding
25
reasoning
27
science估算
24
agents
0
multimodal

Science 在缺少專門科學評測時使用推理能力代理估算。

排行榜排名

領域#排名分數來源
程式碼能力榜371
20.0
AA
通用能力榜413
25.0
AA
數學推理279
27.0
AA
推理能力48
70.0
LS
科學能力401
27.0
AA

基準測試分數 (LLM Stats)

Biology

GPQA66.1%自報

Communication

MT-Bench8.99 / 100自報

Finance

MMLU79.1%自報
TruthfulQA63.3%自報
MMLU-Pro47.2%自報

General

PIQA84.4%自報
ARC-E83.0%自報
IFBench81.2%自報
ARC-C65.5%自報
AGIEval56.2%自報
OpenBookQA49.4%自報

Language

BoolQ88.0%自報
Winogrande83.2%自報
BBH67.8%自報

Math

MATH20.8%自報

Reasoning

HellaSwag88.2%自報
MuSR50.7%自報

AA 評測指數

Intelligence Index
5.1
Mmlu Pro
0.6
Math 500
0.5
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Hle
0.0
Aime
0.0

LLM Stats 分類評分

Roleplay
9
Communication
9
Creativity
9
General
1
Reasoning
1
Instruction Following
80
Physics
80
Language
70
Biology
70
Chemistry
70
Legal
60
Finance
60
Healthcare
60
Math
50

定價

輸入價格$0.3 / 1M tokens
輸出價格$0.3 / 1M tokens
混合價格(3:1)$0.3 / 1M tokens

速度

Tokens/秒30.1
首Token延遲0.35s
首回答延遲0.35s

供應商價格排行

供應商價格排行

4 個供應商

最便宜: Nous Research最貴: OpenRouter
供應商輸入輸出
1Nous Research主要
$0.3
$0.3
2Kilo Gateway
$0.3
$0.3
3NanoGPT
$0.408
$0.408
4OpenRouter
$0.7
$0.7

比較該模型在不同 API 供應商之間的定價。

外部連結