Devstral 2
MistralMistral
リリース日
2025-12-09
パラメータ
—
コンテキスト長
262K
モダリティ
text
能力レーダー
32
general
42
coding
40
reasoning
39
science推定
41
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| コーディングランキング | 242 | 40.0 | AA |
| 総合ランキング | 268 | 39.0 | AA |
| 数学的推論 | 233 | 37.0 | AA |
| 科学 | 282 | 40.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
71.2%自己申告
Code
LiveCodeBench
63.6%自己申告
Creativity
Arena Hard
58.3%自己申告
Finance
MMLU-Pro
78.0%自己申告
General
MMMU-Pro
60.0%自己申告
IFBench
48.0%自己申告
Language
COLLIE
62.9%自己申告
Long Context
AA-LCR
71.2%自己申告
Math
AIME 2025
83.8%自己申告
AA評価指数
Math Index36.7
Intelligence Index15.5
Mmlu Pro0.8
Gpqa0.6
Livecodebench0.4
Ifbench0.4
Aime 250.4
Scicode0.3
Lcr0.3
Tau20.2
Terminalbench Hard0.2
Hle0.0
LLM Statsカテゴリスコア
Legal80
Math80
Finance80
Healthcare80
Language70
Long Context70
Physics70
Reasoning70
Biology70
Chemistry70
Multimodal60
General60
Code60
Creativity60
Vision60
Writing60
Instruction Following50
価格設定
入力価格無料
出力価格無料
混合価格(3:1)無料
速度
トークン/秒70.3
初トークン遅延0.71s
初回答遅延0.71s
プロバイダー価格ランキング
プロバイダー価格ランキング
9 プロバイダー
最安: Scaleway最高: Merge Gateway
プロバイダー入力出力
1Scaleway最安
$0.4
$2
2NanoGPT
$0.4
$1.4
3OpenRouter
$0.4
$2
4Kilo Gateway
$0.4
$2
5Amazon Bedrock
$0.4
$2
6Mistral
$0.4
$2
7Vercel AI Gateway
$0.4
$2
8LLM Gateway
$0.4
$2
9Merge Gateway
$0.4
$2
このモデルの異なるAPIプロバイダー間の価格を比較。