跳转到主要内容

Hermes 3 - Llama-3.1 70B

Nous ResearchLlamaOpen WeightApache 2.0 · Commercial OK

描述

Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.

发布日期
2024-08-15
参数规模
70.0B
上下文长度
131K
支持模态
text

能力雷达图

24
general
20
coding
25
reasoning
27
science估算
0
agents
0
multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域#排名分数来源
代码能力榜347
20.0
AA
通用能力榜382
28.0
AA
数学推理279
27.0
AA
推理能力43
70.0
LS
科学能力381
27.0
AA

基准测试分数 (LLM Stats)

Biology

GPQA66.1%自报

Communication

MT-Bench8.99 / 100自报

Finance

MMLU79.1%自报
TruthfulQA63.3%自报
MMLU-Pro47.2%自报

General

PIQA84.4%自报
ARC-E83.0%自报
IFBench81.2%自报
ARC-C65.5%自报
AGIEval56.2%自报
OpenBookQA49.4%自报

Language

BoolQ88.0%自报
Winogrande83.2%自报
BBH67.8%自报

Math

MATH20.8%自报

Reasoning

HellaSwag88.2%自报
MuSR50.7%自报

AA 评测指数

Intelligence Index
10.6
Mmlu Pro
0.6
Math 500
0.5
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Hle
0.0
Aime
0.0

LLM Stats 分类评分

Communication
9
Creativity
9
Roleplay
9
General
1
Reasoning
1
Instruction Following
80
Physics
80
Biology
70
Chemistry
70
Language
70
Finance
60
Healthcare
60
Legal
60
Math
50

定价

输入价格$0.3 / 1M tokens
输出价格$0.3 / 1M tokens
混合价格(3:1)$0.3 / 1M tokens

速度

Tokens/秒30.6 tokens/s
首Token延迟0.46s
首回答延迟0.46s

可用提供商

(LS 内部计价单位)

暂无提供商数据

外部链接