DeepSeek V3.1 (Reasoning)
Описание
DeepSeek-V3.1 is a hybrid model supporting both thinking and non-thinking modes through different chat templates. Built on DeepSeek-V3.1-Base with a two-phase long context extension (32K phase: 630B tokens, 128K phase: 209B tokens), it features 671B total parameters with 37B activated. Key improvements include smarter tool calling through post-training optimization, higher thinking efficiency achieving comparable quality to DeepSeek-R1-0528 while responding more quickly, and UE8M0 FP8 scale data format for model weights and activations. The model excels in both reasoning tasks (thinking mode) and practical applications (non-thinking mode), with particularly strong performance in code agent tasks, math competitions, and search-based problem solving.
Радар способностей
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Агентные возможности | 116 | 31.0 | LS |
| Рейтинг кодинга | 103 | 65.0 | AA |
| Общий рейтинг | 210 | 48.0 | AA |
| Математическое мышление | 35 | 91.0 | AA |
| Рассуждения | 93 | 49.0 | LS |
| Наука | 137 | 56.0 | AA |
Оценки бенчмарков (LLM Stats)
Agents
Biology
Code
Factuality
Finance
General
Math
Reasoning
Индексы оценки AA
Оценки категорий LLM Stats
Цены
Скорость
Рейтинг цен провайдеров
Рейтинг цен провайдеров
3 провайдеров
Сравнение цен разных API-провайдеров для этой модели.