Перейти к основному содержанию

DeepSeek R1 Distill Llama 70B

DeepSeekLlamaОткрытые весаMIT · Коммерческое использование

Описание

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Дата выхода
2025-01-20
Параметры
70.6B
Длина контекста
8K
Модальности
text

Радар способностей

30
general
28
coding
62
reasoning
30
scienceоцен.
52
agents
0
multimodal

Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.

Рейтинги

Домен#МестоОценкаИсточник
Рейтинг кодинга411
15.0
AA
Общий рейтинг349
32.0
AA
Математическое мышление137
65.0
AA
Наука356
32.0
AA

Оценки бенчмарков (LLM Stats)

Biology

GPQA65.2%Сам.

Code

LiveCodeBench57.5%Сам.

Math

MATH-50094.5%Сам.
AIME 202486.7%Сам.

Индексы оценки AA

Math Index
53.7
Intelligence Index
9.9
Math 500
0.9
Mmlu Pro
0.8
Aime
0.7
Aime 25
0.5
Gpqa
0.4
Scicode
0.3
Ifbench
0.3
Livecodebench
0.3
Tau2
0.2
Lcr
0.1
Hle
0.1
Terminalbench Hard
0.0

Оценки категорий LLM Stats

Math
90
Reasoning
80
Physics
70
Biology
70
Chemistry
70
General
60
Code
60

Цены

Цена ввода$0.7 / 1M токенов
Цена вывода$1.05 / 1M токенов
Смешанная цена (3:1)$0.787 / 1M токенов

Скорость

Токенов/сек40.4
Задержка первого токена0.46s
Время до первого ответа50.02s

Рейтинг цен провайдеров

Рейтинг цен провайдеров

10 провайдеров

Самый дешевый: ChutesСамый дорогой: DigitalOcean
ПровайдерВводВывод
1ChutesСамый дешевый
$0.0272
$0.1087
2Helicone
$0.03
$0.13
3FastRouter
$0.03
$0.14
4Alibaba (China)
$0.287
$0.861
5DeepSeekОсновной
$0.7
$1.05
6NanoGPT
$0.7
$0.7
7Kilo Gateway
$0.7
$0.8
8OpenRouter
$0.8
$0.8
9NovitaAI
$0.8
$0.8
10DigitalOcean
$0.99
$0.99

Сравнение цен разных API-провайдеров для этой модели.

Внешние ссылки