メインコンテンツへスキップ

DeepHermes 3 - Mistral 24B Preview (Non-reasoning)

Nous ResearchMistral

リリース日

2025-03-13

パラメータ

—

コンテキスト長

—

モダリティ

—

能力レーダー

21

general

20

coding

28

reasoning

26

science推定

26

agents

60

multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン	#順位	スコア	ソース
コーディングランキング	353	21.0	AA
総合ランキング	408	25.0	AA
数学的推論	263	31.0	AA
科学	404	26.0	AA

ベンチマークスコア (LLM Stats)

Biology

GPQA

71.2%自己申告

Code

LiveCodeBench

63.6%自己申告

Creativity

Arena Hard

58.3%自己申告

Finance

MMLU-Pro

78.0%自己申告

General

MMMU-Pro

60.0%自己申告

IFBench

48.0%自己申告

Language

COLLIE

62.9%自己申告

Long Context

AA-LCR

71.2%自己申告

Math

AIME 2025

83.8%自己申告

AA評価指数

Intelligence Index

5.3

Math 500

0.6

Mmlu Pro

0.6

Gpqa

0.4

Scicode

0.2

Livecodebench

0.2

Aime

0.0

Hle

0.0

LLM Statsカテゴリスコア

Math

80

Legal

80

Finance

80

Healthcare

80

Physics

70

Reasoning

70

Language

70

Long Context

70

Biology

70

Chemistry

70

Multimodal

60

General

60

Code

60

Creativity

60

Vision

60

Writing

60

Instruction Following

50

価格設定

入力価格無料

出力価格無料

混合価格（3:1）無料

速度

トークン/秒0.0

初トークン遅延0.00s

初回答遅延0.00s

プロバイダー価格ランキング

プロバイダー価格ランキング

2 プロバイダー

最安: Chutes最高: NanoGPT

プロバイダー入力出力

1Chutes最安

$0.0245

$0.0978

2NanoGPT

$0.3

$0.3

このモデルの異なるAPIプロバイダー間の価格を比較。

外部リンク

Artificial Analysis