DeepSeek V4 Flash (Reasoning, Max Effort)
Описание
DeepSeek-V4-Flash-Max is the maximum reasoning effort mode of DeepSeek-V4-Flash, a 284B-parameter MoE model with 13B activated parameters and a 1M-token context window. Sharing the V4 series' hybrid attention architecture (Compressed Sparse Attention combined with Heavily Compressed Attention), Manifold-Constrained Hyper-Connections, and Muon optimizer, V4-Flash-Max delivers reasoning performance comparable to V4-Pro when given a larger thinking budget while operating at a fraction of the parameter scale. It is pre-trained on more than 32T tokens and post-trained with a two-stage paradigm of domain-specific expert cultivation followed by on-policy distillation.
Радар способностей
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 68 | 72.0 | AA |
| Общий рейтинг | 20 | 81.0 | AA |
| Наука | 32 | 76.0 | AA |
Оценки бенчмарков (LLM Stats)
Agents
Biology
Code
Factuality
Finance
General
Math
Индексы оценки AA
Оценки категорий LLM Stats
Цены
Скорость
Рейтинг цен провайдеров
Рейтинг цен провайдеров
4 провайдеров
Сравнение цен разных API-провайдеров для этой модели.