DeepHermes 3 - Llama-3.1 8B Preview (Non-reasoning)

Nous ResearchLlama

Дата выхода

2025-02-13

Параметры

—

Длина контекста

—

Модальности

—

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	455	9.0	AA
Общий рейтинг	488	14.0	AA
Математическое мышление	339	9.0	AA
Наука	478	14.0	AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA

50.5%Сам.

Code

HumanEval

88.4%Сам.

Finance

MMLU

86.0%Сам.

MMLU-Pro

68.9%Сам.

General

IFEval

92.1%Сам.

MBPP EvalPlus

87.6%Сам.

BFCL v2

77.3%Сам.

Math

MGSM

91.1%Сам.

MATH

77.0%Сам.

Индексы оценки AA

Intelligence Index

2.3

Mmlu Pro

0.4

Gpqa

0.3

Math 500

0.2

Scicode

0.1

Livecodebench

0.1

Hle

0.0

Aime

0.0

Оценки категорий LLM Stats

Instruction Following

Structured Output

Code

Language

Legal

Math

Reasoning

Finance

Healthcare

Tool Calling

General

Physics

Biology

Chemistry

Цены

Цена вводаБесплатно

Цена выводаБесплатно

Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0

Задержка первого токена0.00s

Время до первого ответа0.00s

Рейтинг цен провайдеров

Нет данных провайдеров

Внешние ссылки

Artificial Analysis