Перейти к основному содержанию

DeepSeek R1 Distill Qwen 1.5B

DeepSeekDeepSeekОткрытые весаMIT · Коммерческое использование

Описание

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Дата выхода
2025-01-20
Параметры
1.8B
Длина контекста
Модальности

Радар способностей

11
general
7
coding
27
reasoning
7
scienceоцен.
21
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга476
4.0
AA
Общий рейтинг511
9.0
AA
Математическое мышление269
30.0
AA
Наука509
5.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA33.8%Сам.

Code

LiveCodeBench16.9%Сам.

Math

MATH-50083.9%Сам.
AIME 202452.7%Сам.

Индексы оценки AA

Math Index
22.0
Intelligence Index
3.7
Math 500
0.7
Mmlu Pro
0.3
Aime 25
0.2
Aime
0.2
Ifbench
0.1
Gpqa
0.1
Livecodebench
0.1
Scicode
0.1
Hle
0.0
Lcr
0.0

Оценки категорий LLM Stats

Math
70
Reasoning
50
Physics
30
General
30
Biology
30
Chemistry
30
Code
20

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s

Рейтинг цен провайдеров

Нет данных провайдеров

Внешние ссылки