Перейти к основному содержанию

DeepSeek R1 Distill Llama 8B

DeepSeekLlamaOpen WeightMIT · Commercial OK

Описание

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Дата выхода
2025-01-20
Параметры
8.0B
Длина контекста
Модальности

Радар способностей

24
general
21
coding
45
reasoning
19
scienceоцен.
0
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Code Ranking405
13.0
AA
General Ranking422
23.0
AA
Math Reasoning187
49.0
AA
Science438
17.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA49.0%Сам.

Code

LiveCodeBench39.6%Сам.

Math

MATH-50089.1%Сам.
AIME 202480.0%Сам.

Индексы оценки AA

Math Index
41.3
Intelligence Index
12.1
Math 500
0.9
Mmlu Pro
0.5
Aime 25
0.4
Aime
0.3
Gpqa
0.3
Livecodebench
0.2
Ifbench
0.2
Scicode
0.1
Hle
0.0
Lcr
0.0

Оценки категорий LLM Stats

Math
80
Reasoning
60
Biology
50
Chemistry
50
Physics
50
Code
40
General
40

Цены

Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно

Скорость

Токенов/сек0.0 tokens/s
Задержка первого токена0.00s
Время до первого ответа0.00s

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки