Перейти к основному содержанию

DeepSeek R1 Distill Qwen 7B

DeepSeekDeepSeekOpen WeightMIT · Commercial OK

Описание

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Дата выхода
2025-01-20
Параметры
7.6B
Длина контекста
Модальности

Радар способностей

40
general
40
coding
90
reasoning
43
scienceоцен.
0
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Нет данных рейтинга

Оценки бенчмарков (LLM Stats)

Biology

GPQA49.1%Сам.

Code

LiveCodeBench37.6%Сам.

Math

MATH-50092.8%Сам.
AIME 202483.3%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Math
90
Reasoning
70
Biology
50
Chemistry
50
Physics
50
Code
40
General
40

Цены

Нет данных о ценах

Скорость

Нет данных о скорости

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки