DeepSeek V3 (Dec '24)
DeepSeekDeepSeekOpen WeightMIT + Model License (Commercial use allowed)
Описание
A powerful Mixture-of-Experts (MoE) language model with 671B total parameters (37B activated per token). Features Multi-head Latent Attention (MLA), auxiliary-loss-free load balancing, and multi-token prediction training. Pre-trained on 14.8T tokens with strong performance in reasoning, math, and code tasks.
Дата выхода
2024-12-26
Параметры
671.0B
Длина контекста
164K
Модальности
text
Радар способностей
32
general
25
coding
38
reasoning
38
scienceоцен.
0
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Code Ranking | 273 | 29.0 | AA |
| General Ranking | 306 | 36.0 | AA |
| Math Reasoning | 226 | 39.0 | AA |
| Reasoning | 36 | 76.0 | LS |
| Science | 272 | 40.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
59.1%Сам.
Code
Aider-Polyglot Edit
79.7%Сам.
Aider-Polyglot
49.6%Сам.
SWE-Bench Verified
42.0%Сам.
LiveCodeBench
37.6%Сам.
Factuality
SimpleQA
24.9%Сам.
Finance
MMLU
88.5%Сам.
MMLU-Pro
75.9%Сам.
General
MMLU-Redux
89.1%Сам.
C-Eval
86.5%Сам.
IFEval
86.1%Сам.
CSimpleQA
64.8%Сам.
LongBench v2
48.7%Сам.
Language
CLUEWSC
90.9%Сам.
Math
DROP
91.6%Сам.
MATH-500
90.2%Сам.
CNMO 2024
43.2%Сам.
AIME 2024
39.2%Сам.
Reasoning
HumanEval-Mul
82.6%Сам.
FRAMES
73.3%Сам.
Индексы оценки AA
Math Index26.0
Intelligence Index16.5
Coding Index16.4
Math 5000.9
Mmlu Pro0.8
Gpqa0.6
Livecodebench0.4
Scicode0.4
Ifbench0.3
Lcr0.3
Aime 250.3
Aime0.3
Tau20.2
Terminalbench Hard0.1
Hle0.0
Оценки категорий LLM Stats
Instruction Following90
Finance80
Healthcare80
Language80
Legal80
Structured Output70
General70
Math70
Reasoning70
Biology60
Chemistry60
Physics60
Code50
Long Context50
Frontend Development40
Factuality20
Цены
Цена ввода$0.4 / 1M tokens
Цена вывода$0.89 / 1M tokens
Смешанная цена (3:1)$0.523 / 1M tokens
Скорость
Токенов/сек0.0 tokens/s
Задержка первого токена0.00s
Время до первого ответа0.00s
Доступные провайдеры
(Внутренние единицы LS)Нет данных провайдеров