DeepSeek R1 Distill Qwen 14B

DeepSeekDeepSeekОткрытые весаMIT · Коммерческое использование

Описание

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Дата выхода

2025-01-20

Параметры

14.8B

Длина контекста

—

Модальности

—

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	328	25.0	AA
Общий рейтинг	356	31.0	AA
Математическое мышление	132	67.0	AA
Наука	367	31.0	AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA

59.1%Сам.

Code

LiveCodeBench

53.1%Сам.

Math

MATH-500

93.9%Сам.

AIME 2024

80.0%Сам.

Индексы оценки AA

Math Index

55.7

Intelligence Index

9.8

Math 500

0.9

Mmlu Pro

0.7

Aime

0.7

Aime 25

0.6

Gpqa

0.5

Livecodebench

0.4

Scicode

0.2

Ifbench

0.2

Lcr

0.1

Hle

0.0

Оценки категорий LLM Stats

Math

Reasoning

Physics

General

Biology

Chemistry

Code

Цены

Цена вводаБесплатно

Цена выводаБесплатно

Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0

Задержка первого токена0.00s

Время до первого ответа0.00s

Рейтинг цен провайдеров

4 провайдеров

Самый дешевый: SiliconFlow (China)Самый дорогой: NovitaAI

ПровайдерВводВывод

1SiliconFlow (China)Самый дешевый

$0.1

2SiliconFlow

$0.1

3Alibaba (China)

$0.144

$0.431

4NovitaAI

$0.15

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis