Перейти к основному содержанию

DeepSeek R1 Distill Qwen 14B

DeepSeekDeepSeekОткрытые весаMIT · Коммерческое использование

Описание

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Дата выхода
2025-01-20
Параметры
14.8B
Длина контекста
Модальности

Радар способностей

28
general
35
coding
64
reasoning
31
scienceоцен.
55
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга328
25.0
AA
Общий рейтинг356
31.0
AA
Математическое мышление132
67.0
AA
Наука367
31.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA59.1%Сам.

Code

LiveCodeBench53.1%Сам.

Math

MATH-50093.9%Сам.
AIME 202480.0%Сам.

Индексы оценки AA

Math Index
55.7
Intelligence Index
9.8
Math 500
0.9
Mmlu Pro
0.7
Aime
0.7
Aime 25
0.6
Gpqa
0.5
Livecodebench
0.4
Scicode
0.2
Ifbench
0.2
Lcr
0.1
Hle
0.0

Оценки категорий LLM Stats

Math
90
Reasoning
70
Physics
60
General
60
Biology
60
Chemistry
60
Code
50

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

4 провайдеров

Самый дешевый: SiliconFlow (China)Самый дорогой: NovitaAI
ПровайдерВводВывод
1SiliconFlow (China)Самый дешевый
$0.1
$0.1
2SiliconFlow
$0.1
$0.1
3Alibaba (China)
$0.144
$0.431
4NovitaAI
$0.15
$0.15

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки