Перейти к основному содержанию

DeepSeek R1 Distill Qwen 32B

DeepSeekDeepSeekOpen WeightMIT · Commercial OK

Описание

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Дата выхода
2025-01-20
Параметры
32.8B
Длина контекста
33K
Модальности
text

Радар способностей

32
general
29
coding
69
reasoning
42
scienceоцен.
0
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Code Ranking339
21.0
AA
General Ranking305
36.0
AA
Math Reasoning114
72.0
AA
Science231
45.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA62.1%Сам.

Code

LiveCodeBench57.2%Сам.

Math

MATH-50094.3%Сам.
AIME 202483.3%Сам.

Индексы оценки AA

Math Index
63.0
Intelligence Index
17.2
Math 500
0.9
Mmlu Pro
0.7
Aime
0.7
Aime 25
0.6
Gpqa
0.6
Scicode
0.4
Livecodebench
0.3
Ifbench
0.2
Lcr
0.1
Hle
0.1

Оценки категорий LLM Stats

Math
90
Reasoning
70
Biology
60
Chemistry
60
Code
60
General
60
Physics
60

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0 tokens/s
Задержка первого токена0.00s
Время до первого ответа0.00s

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки