DeepSeek V4 Pro (Reasoning, Max Effort)

DeepSeekDeepSeekОткрытые весаMIT · Коммерческое использование

Описание

DeepSeek-V4-Pro-Max is the maximum reasoning effort mode of DeepSeek-V4-Pro, a 1.6T-parameter MoE model with 49B activated parameters and a 1M-token context window. It introduces a hybrid attention architecture combining Compressed Sparse Attention (CSA) and Heavily Compressed Attention (HCA) for dramatically improved long-context efficiency, requiring only 27% of single-token inference FLOPs and 10% of KV cache compared with DeepSeek-V3.2 at 1M-token context. The model also incorporates Manifold-Constrained Hyper-Connections (mHC) for stable signal propagation and is trained with the Muon optimizer for faster convergence. Pre-trained on more than 32T tokens, V4-Pro-Max significantly advances open-source knowledge capabilities, achieves top-tier performance in coding benchmarks, and bridges the gap with leading closed-source models on reasoning and agentic tasks.

Дата выхода

2026-04-24

Параметры

1.6T

Длина контекста

1.0M

Модальности

text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	34	79.0	AA
Общий рейтинг	12	84.0	AA
Наука	21	81.0	AA

Оценки бенчмарков (LLM Stats)

Agents

GDPval-AA

1332.00 / 3000Сам.

BrowseComp

83.4%Сам.

MCP Atlas

73.6%Сам.

Terminal-Bench 2.0

67.9%Сам.

SWE-Bench Pro

55.4%Сам.

Toolathlon

51.8%Сам.

FrontierSWE

29.0%Сам.

Biology

GPQA

90.1%Сам.

Code

LiveCodeBench

93.5%Сам.

SWE-Bench Verified

80.6%Сам.

SWE-bench Multilingual

76.2%Сам.

Factuality

SimpleQA

57.9%Сам.

Finance

MMLU-Pro

87.5%Сам.

General

CSimpleQA

84.4%Сам.

MRCR 1M

83.5%Сам.

LiveBench

73.6%Сам.

CorpusQA 1M

62.0%Сам.

Math

CodeForces

1.00 / 3000Сам.

HMMT Feb 26

95.2%Сам.

MathArena Apex

90.2%Сам.

IMO-AnswerBench

89.8%Сам.

Humanity's Last Exam

48.2%Сам.

Индексы оценки AA

Coding Index

59.4

Intelligence Index

44.3

Tau2

1.0

Gpqa

0.9

Ifbench

0.8

Lcr

0.7

Terminalbench V2 1

0.6

Scicode

0.5

Terminalbench Hard

0.5

Hle

0.4

Tau Banking

0.3

Оценки категорий LLM Stats

Legal

100

Finance

100

Agents

100

General

100

Reasoning

Language

Physics

Healthcare

Biology

Chemistry

Long Context

Math

Frontend Development

Code

Factuality

Tool Calling

Vision

Цены

Цена ввода$0.435 / 1M токенов

Цена вывода$0.87 / 1M токенов

Смешанная цена (3:1)$0.544 / 1M токенов

Цена чтения кэша$0.00363 / 1M токенов

Скорость

Токенов/сек103.1

Задержка первого токена0.99s

Время до первого ответа43.43s

Рейтинг цен провайдеров

7 провайдеров

Самый дешевый: DeepSeekСамый дорогой: Poe

ПровайдерВводВывод

1DeepSeekСамый дешевый

2DeepInfra

3NanoGPT

$0.435

$0.87

4AIHubMix

$0.478

$0.956

5routing.run

$0.4928

$0.7392

6CrofAI

$0.8

$1.6

7Poe

$1.67

$3.33

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis