Hermes 3 - Llama-3.1 70B
Nous ResearchLlamaOpen WeightApache 2.0 · Commercial OK
描述
Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.
發布日期
2024-08-15
參數規模
70.0B
上下文長度
131K
支援模態
text
能力雷達圖
24
general
20
coding
25
reasoning
27
science估算
0
agents
0
multimodal
Science 在缺少專門科學評測時使用推理能力代理估算。
排行榜排名
基準測試分數 (LLM Stats)
Biology
GPQA
66.1%自報
Communication
MT-Bench
8.99 / 100自報
Finance
MMLU
79.1%自報
TruthfulQA
63.3%自報
MMLU-Pro
47.2%自報
General
PIQA
84.4%自報
ARC-E
83.0%自報
IFBench
81.2%自報
ARC-C
65.5%自報
AGIEval
56.2%自報
OpenBookQA
49.4%自報
Language
BoolQ
88.0%自報
Winogrande
83.2%自報
BBH
67.8%自報
Math
MATH
20.8%自報
Reasoning
HellaSwag
88.2%自報
MuSR
50.7%自報
AA 評測指數
Intelligence Index10.6
Mmlu Pro0.6
Math 5000.5
Gpqa0.4
Scicode0.2
Livecodebench0.2
Hle0.0
Aime0.0
LLM Stats 分類評分
Communication9
Creativity9
Roleplay9
General1
Reasoning1
Instruction Following80
Physics80
Biology70
Chemistry70
Language70
Finance60
Healthcare60
Legal60
Math50
定價
輸入價格$0.3 / 1M tokens
輸出價格$0.3 / 1M tokens
混合價格(3:1)$0.3 / 1M tokens
速度
Tokens/秒30.6 tokens/s
首Token延遲0.46s
首回答延遲0.46s
可用提供商
(LS 內部計價單位)暫無提供商資料