跳转到主要内容

Hermes 4 - Llama-3.1 405B (Reasoning)

Nous ResearchLlama
发布日期
2025-08-27
参数规模
上下文长度
131K
支持模态
text

能力雷达图

37
general
35
coding
70
reasoning
44
science估算
0
agents
0
multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域#排名分数来源
代码能力榜236
35.0
AA
通用能力榜272
39.0
AA
数学推理120
70.0
AA
科学能力218
46.0
AA

基准测试分数 (LLM Stats)

暂无基准测试数据

AA 评测指数

Math Index
69.7
Intelligence Index
18.6
Coding Index
16.0
Mmlu Pro
0.8
Gpqa
0.7
Aime 25
0.7
Livecodebench
0.7
Ifbench
0.3
Scicode
0.3
Tau2
0.2
Lcr
0.2
Terminalbench Hard
0.1
Hle
0.1

LLM Stats 分类评分

暂无分类评分数据

定价

输入价格$1 / 1M tokens
输出价格$3 / 1M tokens
混合价格(3:1)$1.5 / 1M tokens

速度

Tokens/秒39.1 tokens/s
首Token延迟0.76s
首回答延迟51.97s

可用提供商

(LS 内部计价单位)

暂无提供商数据

外部链接

暂无外部链接