DeepHermes 3 - Mistral 24B Preview (Non-reasoning)
Nous ResearchMistral
リリース日
2025-03-13
パラメータ
—
コンテキスト長
—
モダリティ
—
能力レーダー
21
general
20
coding
28
reasoning
26
science推定
26
agents
60
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 353 | 21.0 | AA |
| 総合ランキング | 408 | 25.0 | AA |
| 数学的推論 | 263 | 31.0 | AA |
| 科学 | 404 | 26.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
71.2%自己申告
Code
LiveCodeBench
63.6%自己申告
Creativity
Arena Hard
58.3%自己申告
Finance
MMLU-Pro
78.0%自己申告
General
MMMU-Pro
60.0%自己申告
IFBench
48.0%自己申告
Language
COLLIE
62.9%自己申告
Long Context
AA-LCR
71.2%自己申告
Math
AIME 2025
83.8%自己申告
AA評価指数
Intelligence Index5.3
Math 5000.6
Mmlu Pro0.6
Gpqa0.4
Scicode0.2
Livecodebench0.2
Aime0.0
Hle0.0
LLM Statsカテゴリスコア
Math80
Legal80
Finance80
Healthcare80
Physics70
Reasoning70
Language70
Long Context70
Biology70
Chemistry70
Multimodal60
General60
Code60
Creativity60
Vision60
Writing60
Instruction Following50
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
速度
トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s
プロバイダー価格ランキング
プロバイダー価格ランキング
2 プロバイダー
最安: Chutes最高: NanoGPT
プロバイダー入力出力
1Chutes最安
$0.0245
$0.0978
2NanoGPT
$0.3
$0.3
このモデルの異なるAPIプロバイダー間の価格を比較。