MiniMax-M2.7
Описание
MiniMax M2.7 features model self-improvement driving productivity innovation. It builds complex agent harnesses independently to accomplish highly complex productivity tasks. M2.7 demonstrates excellent performance in real-world software engineering including end-to-end project delivery, log analysis, code security, and ML tasks. On SWE-Pro it scores 56.22%, nearly matching Opus. It excels in professional office domains achieving the highest ELO among open-source models on GDPval-AA (1495), with significant improvement in complex editing for Office Suite. M2.7 maintains 97% skill adherence on 40 complex skills cases.
Радар способностей
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Агентные возможности | 89 | 49.0 | LS |
| Рейтинг кодинга | 64 | 73.0 | AA |
| Общий рейтинг | 48 | 75.0 | AA |
| Наука | 40 | 74.0 | AA |
Оценки бенчмарков (LLM Stats)
Agents
Code
General
Индексы оценки AA
Оценки категорий LLM Stats
Цены
Скорость
Рейтинг цен провайдеров
Рейтинг цен провайдеров
29 провайдеров
Сравнение цен разных API-провайдеров для этой модели.