Devstral Small (May '25)
MistralMistral
リリース日
2025-05-21
パラメータ
—
コンテキスト長
256K
モダリティ
image, text
能力レーダー
26
general
26
coding
33
reasoning
29
science推定
31
agents
60
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 336 | 24.0 | AA |
| 総合ランキング | 319 | 34.0 | AA |
| 数学的推論 | 240 | 37.0 | AA |
| 科学 | 384 | 29.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
71.2%自己申告
Code
LiveCodeBench
63.6%自己申告
Creativity
Arena Hard
58.3%自己申告
Finance
MMLU-Pro
78.0%自己申告
General
MMMU-Pro
60.0%自己申告
IFBench
48.0%自己申告
Language
COLLIE
62.9%自己申告
Long Context
AA-LCR
71.2%自己申告
Math
AIME 2025
83.8%自己申告
AA評価指数
Intelligence Index11.8
Math 5000.7
Mmlu Pro0.6
Gpqa0.4
Tau20.4
Ifbench0.3
Lcr0.3
Livecodebench0.3
Scicode0.2
Aime0.1
Terminalbench Hard0.1
Hle0.0
LLM Statsカテゴリスコア
Legal80
Math80
Finance80
Healthcare80
Language70
Long Context70
Physics70
Reasoning70
Biology70
Chemistry70
Multimodal60
General60
Code60
Creativity60
Vision60
Writing60
Instruction Following50
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
速度
トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s
プロバイダー価格ランキング
プロバイダー価格ランキング
3 プロバイダー
最安: IO.NET最高: Mistral
プロバイダー入力出力
1IO.NET最安
$0.05
$0.22
2NanoGPT
$0.06
$0.06
3Mistral
$0.1
$0.3
このモデルの異なるAPIプロバイダー間の価格を比較。