跳转到主要内容

DeepHermes 3 - Mistral 24B Preview (Non-reasoning)

Nous ResearchMistral

发布日期

2025-03-13

参数规模

—

上下文长度

—

支持模态

—

能力雷达图

21

general

20

coding

28

reasoning

26

science估算

26

agents

60

multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域	#排名	分数	来源
代码能力榜	353	21.0	AA
通用能力榜	408	25.0	AA
数学推理	263	31.0	AA
科学能力	404	26.0	AA

基准测试分数 (LLM Stats)

Biology

GPQA

71.2%自报

Code

LiveCodeBench

63.6%自报

Creativity

Arena Hard

58.3%自报

Finance

MMLU-Pro

78.0%自报

General

MMMU-Pro

60.0%自报

IFBench

48.0%自报

Language

COLLIE

62.9%自报

Long Context

AA-LCR

71.2%自报

Math

AIME 2025

83.8%自报

AA 评测指数

Intelligence Index

5.3

Math 500

0.6

Mmlu Pro

0.6

Gpqa

0.4

Scicode

0.2

Livecodebench

0.2

Aime

0.0

Hle

0.0

LLM Stats 分类评分

Legal

80

Math

80

Finance

80

Healthcare

80

Language

70

Long Context

70

Physics

70

Reasoning

70

Biology

70

Chemistry

70

Multimodal

60

General

60

Code

60

Creativity

60

Vision

60

Writing

60

Instruction Following

50

定价

输入价格免费

输出价格免费

混合价格(3:1)免费

速度

Tokens/秒0.0

首Token延迟0.00s

首回答延迟0.00s

供应商价格排行

供应商价格排行

2 个供应商

最便宜: Chutes最贵: NanoGPT

供应商输入输出

1Chutes最便宜

$0.0245

$0.0978

2NanoGPT

$0.3

$0.3

比较该模型在不同 API 供应商之间的定价。

外部链接

Artificial Analysis