DeepSeek V4 Flash (Non-reasoning)
विवरण
DeepSeek-V4-Flash-Max is the maximum reasoning effort mode of DeepSeek-V4-Flash, a 284B-parameter MoE model with 13B activated parameters and a 1M-token context window. Sharing the V4 series' hybrid attention architecture (Compressed Sparse Attention combined with Heavily Compressed Attention), Manifold-Constrained Hyper-Connections, and Muon optimizer, V4-Flash-Max delivers reasoning performance comparable to V4-Pro when given a larger thinking budget while operating at a fraction of the parameter scale. It is pre-trained on more than 32T tokens and post-trained with a two-stage paradigm of domain-specific expert cultivation followed by on-policy distillation.
क्षमता रडार
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| एजेंटिक क्षमता | 52 | 56.0 | LS |
| कोडिंग रैंकिंग | 194 | 49.0 | AA |
| सामान्य रैंकिंग | 126 | 60.0 | AA |
| विज्ञान | 191 | 49.0 | AA |
बेंचमार्क स्कोर (LLM Stats)
Agents
Biology
Code
Factuality
Finance
General
Math
AA मूल्यांकन सूचकांक
LLM Stats श्रेणी स्कोर
मूल्य निर्धारण
गति
प्रदाता मूल्य रैंकिंग
प्रदाता मूल्य रैंकिंग
11 प्रदाता
इस मॉडल के लिए विभिन्न API प्रदाताओं के मूल्य निर्धारण की तुलना करें।