DeepSeek R1 Distill Qwen 32B

DeepSeekDeepSeekОткрытые весаMIT · Коммерческое использование

Описание

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Дата выхода

2025-01-20

Параметры

32.8B

Длина контекста

—

Модальности

text

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен	#Место	Оценка	Источник
Рейтинг кодинга	361	21.0	AA
Общий рейтинг	336	33.0	AA
Математическое мышление	113	72.0	AA
Наука	253	44.0	AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA

62.1%Сам.

Code

LiveCodeBench

57.2%Сам.

Math

MATH-500

94.3%Сам.

AIME 2024

83.3%Сам.

Индексы оценки AA

Math Index

63.0

Intelligence Index

11.0

Math 500

0.9

Mmlu Pro

0.7

Aime

0.7

Aime 25

0.6

Gpqa

0.6

Scicode

0.4

Livecodebench

0.3

Ifbench

0.2

Lcr

0.1

Hle

0.1

Оценки категорий LLM Stats

Math

Reasoning

Physics

General

Biology

Chemistry

Code

Цены

Цена вводаБесплатно

Цена выводаБесплатно

Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0

Задержка первого токена0.00s

Время до первого ответа0.00s

Рейтинг цен провайдеров

8 провайдеров

Самый дешевый: SiliconFlow (China)Самый дорогой: NanoGPT

ПровайдерВводВывод

1SiliconFlow (China)Самый дешевый

$0.18

2SiliconFlow

$0.18

3Alibaba (China)

$0.287

$0.861

4Kilo Gateway

$0.29

5NovitaAI

$0.3

6Cloudflare Workers AI

$0.497

$4.881

7Cloudflare AI Gateway

$0.5

$4.88

8NanoGPT

$1.4

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis