Hermes 3 - Llama-3.1 70B

Nous ResearchLlamaOpen WeightApache 2.0 · Commercial OK

Description

Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.

Release Date

2024-08-15

Parameters

70.0B

Context Length

131K

Modalities

text

Capability Radar

general

coding

reasoning

scienceest.

agents

multimodal

Science uses a reasoning proxy when dedicated science benchmarks are unavailable.

Rankings

Domain	#Rank	Score	Source
Code Ranking	371	20.0	AA
General Ranking	413	25.0	AA
Math Reasoning	279	27.0	AA
Reasoning	48	70.0	LS
Science	401	27.0	AA

Benchmark Scores (LLM Stats)

Biology

GPQA

66.1%SR

Communication

MT-Bench

8.99 / 100SR

Finance

MMLU

79.1%SR

TruthfulQA

63.3%SR

MMLU-Pro

47.2%SR

General

PIQA

84.4%SR

ARC-E

83.0%SR

IFBench

81.2%SR

ARC-C

65.5%SR

AGIEval

56.2%SR

OpenBookQA

49.4%SR

Language

BoolQ

88.0%SR

Winogrande

83.2%SR

BBH

67.8%SR

Math

MATH

20.8%SR

Reasoning

HellaSwag

88.2%SR

MuSR

50.7%SR

AA Evaluation Indices

Intelligence Index

5.1

Mmlu Pro

0.6

Math 500

0.5

Gpqa

0.4

Scicode

0.2

Livecodebench

0.2

Hle

0.0

Aime

0.0

LLM Stats Category Scores

Roleplay

Communication

Creativity

General

Reasoning

Instruction Following

Physics

Language

Biology

Chemistry

Legal

Finance

Healthcare

Math

Pricing

Input Price$0.3 / 1M tokens

Output Price$0.3 / 1M tokens

Blended Price (3:1)$0.3 / 1M tokens

Speed

Tokens/sec30.1

Time to First Token0.35s

Time to Answer0.35s

Provider Price Ranking

4 providers

Cheapest: Nous ResearchMost Expensive: OpenRouter

ProviderInputOutput

1Nous ResearchPRIMARY

$0.3

2Kilo Gateway

$0.3

3NanoGPT

$0.408

4OpenRouter

$0.7

Compare pricing across different API providers for this model.

External Sources

LLM Stats Artificial Analysis