DeepSeek R1 Distill Qwen 7B

DeepSeekDeepSeekОткрытые весаMIT · Коммерческое использование

Описание

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Дата выхода

2025-01-20

Параметры

7.6B

Длина контекста

—

Модальности

—

Радар способностей

general

coding

reasoning

scienceоцен.

agents

multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Нет данных рейтинга

Оценки бенчмарков (LLM Stats)

Biology

GPQA

49.1%Сам.

Code

LiveCodeBench

37.6%Сам.

Math

MATH-500

92.8%Сам.

AIME 2024

83.3%Сам.

Индексы оценки AA

Нет данных AA оценки

Оценки категорий LLM Stats

Math

Reasoning

Physics

Biology

Chemistry

General

Code

Цены

Нет данных о ценах

Скорость

Нет данных о скорости

Рейтинг цен провайдеров

1 провайдеров

ПровайдерВводВывод

1Alibaba (China)

$0.072

$0.144

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки

LLM Stats Artificial Analysis