メインコンテンツへスキップ

DeepHermes 3 - Llama-3.1 8B Preview (Non-reasoning)

Nous ResearchLlama

リリース日

2025-02-13

パラメータ

—

コンテキスト長

—

モダリティ

—

能力レーダー

13

general

9

coding

12

reasoning

16

science推定

80

agents

0

multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン	#順位	スコア	ソース
コーディングランキング	455	9.0	AA
総合ランキング	488	14.0	AA
数学的推論	339	9.0	AA
科学	478	14.0	AA

ベンチマークスコア (LLM Stats)

Biology

GPQA

50.5%自己申告

Code

HumanEval

88.4%自己申告

Finance

MMLU

86.0%自己申告

MMLU-Pro

68.9%自己申告

General

IFEval

92.1%自己申告

MBPP EvalPlus

87.6%自己申告

BFCL v2

77.3%自己申告

Math

MGSM

91.1%自己申告

MATH

77.0%自己申告

AA評価指数

Intelligence Index

2.3

Mmlu Pro

0.4

Gpqa

0.3

Math 500

0.2

Scicode

0.1

Livecodebench

0.1

Hle

0.0

Aime

0.0

LLM Statsカテゴリスコア

Instruction Following

90

Structured Output

90

Code

90

Language

80

Legal

80

Math

80

Reasoning

80

Finance

80

Healthcare

80

Tool Calling

80

General

70

Physics

50

Biology

50

Chemistry

50

価格設定

入力価格無料

出力価格無料

混合価格（3:1）無料

速度

トークン/秒0.0

初トークン遅延0.00s

初回答遅延0.00s

プロバイダー価格ランキング

プロバイダーデータがありません

外部リンク

Artificial Analysis