DeepSeek V3 0324
DeepSeekDeepSeekOpen WeightMIT + Model License (Commercial use allowed)
Описание
A powerful Mixture-of-Experts (MoE) language model with 671B total parameters (37B activated per token). Features Multi-head Latent Attention (MLA), auxiliary-loss-free load balancing, and multi-token prediction training. Pre-trained on 14.8T tokens with strong performance in reasoning, math, and code tasks.
Дата выхода
2025-03-25
Параметры
671.0B
Длина контекста
164K
Модальности
text
Радар способностей
38
general
30
coding
54
reasoning
43
scienceоцен.
0
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 217 | 39.0 | AA |
| General Ranking | 209 | 49.0 | AA |
| Math Reasoning | 164 | 54.0 | AA |
| Science | 232 | 45.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
68.4%Сам.
Code
LiveCodeBench
49.2%Сам.
Finance
MMLU-Pro
81.2%Сам.
Math
MATH-500
94.0%Сам.
AIME 2024
59.4%Сам.
Индексы оценки AA
Math Index41.0
Intelligence Index22.3
Coding Index22.0
Math 5000.9
Mmlu Pro0.8
Gpqa0.7
Aime0.5
Tau20.5
Aime 250.4
Ifbench0.4
Lcr0.4
Livecodebench0.4
Scicode0.4
Terminalbench Hard0.2
Hle0.1
Оценки категорий LLM Stats
Finance80
Healthcare80
Language80
Legal80
Math80
Biology70
Chemistry70
General70
Physics70
Reasoning70
Code50
Цены
Цена ввода$1.195 / 1M tokens
Цена вывода$1.25 / 1M tokens
Смешанная цена (3:1)$1.209 / 1M tokens
Скорость
Токенов/сек0.0 tokens/s
Задержка первого токена0.00s
Время до первого ответа0.00s
Доступные провайдеры
(Внутренние единицы LS)| Провайдер | Цена ввода | Цена вывода |
|---|---|---|
| Novita | 280K | 1.1M |