DeepSeek V4 Flash (Non-reasoning)
Описание
DeepSeek-V4-Flash-Max is the maximum reasoning effort mode of DeepSeek-V4-Flash, a 284B-parameter MoE model with 13B activated parameters and a 1M-token context window. Sharing the V4 series' hybrid attention architecture (Compressed Sparse Attention combined with Heavily Compressed Attention), Manifold-Constrained Hyper-Connections, and Muon optimizer, V4-Flash-Max delivers reasoning performance comparable to V4-Pro when given a larger thinking budget while operating at a fraction of the parameter scale. It is pre-trained on more than 32T tokens and post-trained with a two-stage paradigm of domain-specific expert cultivation followed by on-policy distillation.
Радар способностей
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Агентные возможности | 52 | 56.0 | LS |
| Рейтинг кодинга | 194 | 49.0 | AA |
| Общий рейтинг | 126 | 60.0 | AA |
| Наука | 191 | 49.0 | AA |
Оценки бенчмарков (LLM Stats)
Agents
Biology
Code
Factuality
Finance
General
Math
Индексы оценки AA
Оценки категорий LLM Stats
Цены
Скорость
Рейтинг цен провайдеров
Рейтинг цен провайдеров
11 провайдеров
Сравнение цен разных API-провайдеров для этой модели.