MiniMax-M2.7
Description
MiniMax M2.7 features model self-improvement driving productivity innovation. It builds complex agent harnesses independently to accomplish highly complex productivity tasks. M2.7 demonstrates excellent performance in real-world software engineering including end-to-end project delivery, log analysis, code security, and ML tasks. On SWE-Pro it scores 56.22%, nearly matching Opus. It excels in professional office domains achieving the highest ELO among open-source models on GDPval-AA (1495), with significant improvement in complex editing for Office Suite. M2.7 maintains 97% skill adherence on 40 complex skills cases.
Radar de capacités
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
| Domaine | #Rang | Score | Source |
|---|---|---|---|
| Capacité agentique | 89 | 49.0 | LS |
| Classement codage | 64 | 73.0 | AA |
| Classement général | 48 | 75.0 | AA |
| Science | 40 | 74.0 | AA |
Scores de benchmarks (LLM Stats)
Agents
Code
General
Indices d'évaluation AA
Scores par catégorie LLM Stats
Tarification
Vitesse
Classement des Prix par Fournisseur
Classement des Prix par Fournisseur
29 fournisseurs
Comparer les prix entre différents fournisseurs API pour ce modèle.