DeepSeek V4 Flash (Reasoning, Max Effort)

DeepSeekDeepSeekОткрытые весаMIT · Коммерческое использование

Описание

DeepSeek-V4-Flash-Max is the maximum reasoning effort mode of DeepSeek-V4-Flash, a 284B-parameter MoE model with 13B activated parameters and a 1M-token context window. Sharing the V4 series' hybrid attention architecture (Compressed Sparse Attention combined with Heavily Compressed Attention), Manifold-Constrained Hyper-Connections, and Muon optimizer, V4-Flash-Max delivers reasoning performance comparable to V4-Pro when given a larger thinking budget while operating at a fraction of the parameter scale. It is pre-trained on more than 32T tokens and post-trained with a two-stage paradigm of domain-specific expert cultivation followed by on-policy distillation.

Дата выхода

2026-04-24

Параметры

284.0B

Длина контекста

1.0M

Модальности

text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	68	72.0	AA
Общий рейтинг	20	81.0	AA
Наука	32	76.0	AA

Оценки бенчмарков (LLM Stats)

Agents

GDPval-AA

1203.00 / 3000Сам.

BrowseComp

73.2%Сам.

MCP Atlas

69.0%Сам.

Terminal-Bench 2.0

56.9%Сам.

SWE-Bench Pro

52.6%Сам.

Toolathlon

47.8%Сам.

Biology

GPQA

88.1%Сам.

Code

LiveCodeBench

91.6%Сам.

SWE-Bench Verified

79.0%Сам.

SWE-bench Multilingual

73.3%Сам.

Factuality

SimpleQA

34.1%Сам.

Finance

MMLU-Pro

86.2%Сам.

General

CSimpleQA

78.9%Сам.

MRCR 1M

78.7%Сам.

CorpusQA 1M

60.5%Сам.

Math

CodeForces

1.00 / 3000Сам.

HMMT Feb 26

94.8%Сам.

IMO-AnswerBench

88.4%Сам.

MathArena Apex

85.7%Сам.

Humanity's Last Exam

45.1%Сам.

Индексы оценки AA

Coding Index

56.2

Intelligence Index

40.3

Tau2

1.0

Gpqa

0.9

Ifbench

0.8

Lcr

0.6

Terminalbench V2 1

0.6

Scicode

0.4

Terminalbench Hard

0.4

Hle

0.3

Tau Banking

0.2

Оценки категорий LLM Stats

Legal

100

Finance

100

Agents

100

General

100

Reasoning

Physics

Healthcare

Biology

Chemistry

Language

Long Context

Math

Frontend Development

Code

Tool Calling

Vision

Factuality

Цены

Цена ввода$0.14 / 1M токенов

Цена вывода$0.28 / 1M токенов

Смешанная цена (3:1)$0.175 / 1M токенов

Цена чтения кэша$0.0028 / 1M токенов

Скорость

Токенов/сек116.1

Задержка первого токена1.05s

Время до первого ответа49.40s

Рейтинг цен провайдеров

4 провайдеров

Самый дешевый: DeepSeekСамый дорогой: routing.run

ПровайдерВводВывод

1DeepSeekСамый дешевый

2Poe

$0.14

$0.28

3AIHubMix

$0.14

$0.28

4routing.run

$0.4928

$0.7392

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis