跳转到主要内容

Devstral Medium

MistralMistralProprietary

描述

Devstral Medium builds upon the strengths of Devstral Small and takes performance to the next level with a score of 61.6% on SWE-Bench Verified. Devstral Medium is available through the Mistral public API, and offers exceptional performance at a competitive price point, making it an ideal choice for businesses and developers looking for a high-quality, cost-effective model.

发布日期
2025-07-10
参数规模
上下文长度
131K
支持模态
text

能力雷达图

32
general
23
coding
20
reasoning
33
science估算
0
agents
0
multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域#排名分数来源
代码能力榜272
29.0
AA
通用能力榜328
34.0
AA
数学推理313
18.0
AA
科学能力320
34.0
AA

基准测试分数 (LLM Stats)

Code

SWE-Bench Verified61.6%自报

AA 评测指数

Intelligence Index
18.7
Coding Index
15.9
Math Index
4.7
Mmlu Pro
0.7
Math 500
0.7
Gpqa
0.5
Livecodebench
0.3
Ifbench
0.3
Scicode
0.3
Lcr
0.3
Tau2
0.2
Terminalbench Hard
0.1
Aime
0.1
Aime 25
0.0
Hle
0.0

LLM Stats 分类评分

Code
60
Frontend Development
60
Reasoning
60

定价

输入价格$0.4 / 1M tokens
输出价格$2 / 1M tokens
混合价格(3:1)$0.8 / 1M tokens

速度

Tokens/秒78.3 tokens/s
首Token延迟0.49s
首回答延迟0.49s

可用提供商

(LS 内部计价单位)

暂无提供商数据

外部链接