Перейти к основному содержанию

Hermes 3 - Llama-3.1 70B

Nous ResearchLlamaОткрытые весаApache 2.0 · Коммерческое использование

Описание

Hermes 3 70B is Nous Research's flagship instruction-following model, fine-tuned for advanced reasoning, creative writing, and complex task completion. It features exceptional instruction adherence and strong performance across multiple domains.

Дата выхода
2024-08-15
Параметры
70.0B
Длина контекста
131K
Модальности
text

Радар способностей

21
general
20
coding
25
reasoning
27
scienceоцен.
24
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга371
20.0
AA
Общий рейтинг413
25.0
AA
Математическое мышление279
27.0
AA
Рассуждения48
70.0
LS
Наука401
27.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA66.1%Сам.

Communication

MT-Bench8.99 / 100Сам.

Finance

MMLU79.1%Сам.
TruthfulQA63.3%Сам.
MMLU-Pro47.2%Сам.

General

PIQA84.4%Сам.
ARC-E83.0%Сам.
IFBench81.2%Сам.
ARC-C65.5%Сам.
AGIEval56.2%Сам.
OpenBookQA49.4%Сам.

Language

BoolQ88.0%Сам.
Winogrande83.2%Сам.
BBH67.8%Сам.

Math

MATH20.8%Сам.

Reasoning

HellaSwag88.2%Сам.
MuSR50.7%Сам.

Индексы оценки AA

Intelligence Index
5.1
Mmlu Pro
0.6
Math 500
0.5
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Hle
0.0
Aime
0.0

Оценки категорий LLM Stats

Roleplay
9
Communication
9
Creativity
9
General
1
Reasoning
1
Instruction Following
80
Physics
80
Language
70
Biology
70
Chemistry
70
Legal
60
Finance
60
Healthcare
60
Math
50

Цены

Цена ввода$0.3 / 1M токенов
Цена вывода$0.3 / 1M токенов
Смешанная цена (3:1)$0.3 / 1M токенов

Скорость

Токенов/сек30.1
Задержка первого токена0.35s
Время до первого ответа0.35s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

4 провайдеров

Самый дешевый: Nous ResearchСамый дорогой: OpenRouter
ПровайдерВводВывод
1Nous ResearchОсновной
$0.3
$0.3
2Kilo Gateway
$0.3
$0.3
3NanoGPT
$0.408
$0.408
4OpenRouter
$0.7
$0.7

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки