Перейти к основному содержанию

DeepHermes 3 - Llama-3.1 8B Preview (Non-reasoning)

Nous ResearchLlama
Дата выхода
2025-02-13
Параметры
Длина контекста
Модальности

Радар способностей

13
general
9
coding
12
reasoning
16
scienceоцен.
80
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга455
9.0
AA
Общий рейтинг488
14.0
AA
Математическое мышление339
9.0
AA
Наука478
14.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA50.5%Сам.

Code

HumanEval88.4%Сам.

Finance

MMLU86.0%Сам.
MMLU-Pro68.9%Сам.

General

IFEval92.1%Сам.
MBPP EvalPlus87.6%Сам.
BFCL v277.3%Сам.

Math

MGSM91.1%Сам.
MATH77.0%Сам.

Индексы оценки AA

Intelligence Index
2.3
Mmlu Pro
0.4
Gpqa
0.3
Math 500
0.2
Scicode
0.1
Livecodebench
0.1
Hle
0.0
Aime
0.0

Оценки категорий LLM Stats

Instruction Following
90
Structured Output
90
Code
90
Language
80
Legal
80
Math
80
Reasoning
80
Finance
80
Healthcare
80
Tool Calling
80
General
70
Physics
50
Biology
50
Chemistry
50

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s

Рейтинг цен провайдеров

Нет данных провайдеров

Внешние ссылки