Перейти к основному содержанию

DeepSeek R1 Distill Llama 70B

DeepSeekLlamaOpen WeightMIT · Commercial OK

Описание

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Дата выхода
2025-01-20
Параметры
70.6B
Длина контекста
131K
Модальности
text

Радар способностей

34
general
19
coding
62
reasoning
30
scienceоцен.
0
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Code Ranking365
17.0
AA
General Ranking323
34.0
AA
Math Reasoning136
65.0
AA
Science326
33.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA65.2%Сам.

Code

LiveCodeBench57.5%Сам.

Math

MATH-50094.5%Сам.
AIME 202486.7%Сам.

Индексы оценки AA

Math Index
53.7
Intelligence Index
16.0
Coding Index
11.4
Math 500
0.9
Mmlu Pro
0.8
Aime
0.7
Aime 25
0.5
Gpqa
0.4
Scicode
0.3
Ifbench
0.3
Livecodebench
0.3
Tau2
0.2
Lcr
0.1
Hle
0.1
Terminalbench Hard
0.0

Оценки категорий LLM Stats

Math
90
Reasoning
80
Biology
70
Chemistry
70
Physics
70
Code
60
General
60

Цены

Цена ввода$0.7 / 1M tokens
Цена вывода$1.05 / 1M tokens
Смешанная цена (3:1)$0.787 / 1M tokens

Скорость

Токенов/сек43.5 tokens/s
Задержка первого токена0.38s
Время до первого ответа46.36s

Доступные провайдеры

(Внутренние единицы LS)

Нет данных провайдеров

Внешние ссылки