DeepSeek R1 Distill Llama 70B
DeepSeekLlamaОткрытые весаMIT · Коммерческое использование
Описание
DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.
Дата выхода
2025-01-20
Параметры
70.6B
Длина контекста
8K
Модальности
text
Радар способностей
30
general
28
coding
62
reasoning
30
scienceоцен.
52
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 411 | 15.0 | AA |
| Общий рейтинг | 349 | 32.0 | AA |
| Математическое мышление | 137 | 65.0 | AA |
| Наука | 356 | 32.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
65.2%Сам.
Code
LiveCodeBench
57.5%Сам.
Math
MATH-500
94.5%Сам.
AIME 2024
86.7%Сам.
Индексы оценки AA
Math Index53.7
Intelligence Index9.9
Math 5000.9
Mmlu Pro0.8
Aime0.7
Aime 250.5
Gpqa0.4
Scicode0.3
Ifbench0.3
Livecodebench0.3
Tau20.2
Lcr0.1
Hle0.1
Terminalbench Hard0.0
Оценки категорий LLM Stats
Math90
Reasoning80
Physics70
Biology70
Chemistry70
General60
Code60
Цены
Цена ввода$0.7 / 1M токенов
Цена вывода$1.05 / 1M токенов
Смешанная цена (3:1)$0.787 / 1M токенов
Скорость
Токенов/сек40.4
Задержка первого токена0.46s
Время до первого ответа50.02s
Рейтинг цен провайдеров
Рейтинг цен провайдеров
10 провайдеров
Самый дешевый: ChutesСамый дорогой: DigitalOcean
ПровайдерВводВывод
1ChutesСамый дешевый
$0.0272
$0.1087
2Helicone
$0.03
$0.13
3FastRouter
$0.03
$0.14
4Alibaba (China)
$0.287
$0.861
5DeepSeekОсновной
$0.7
$1.05
6NanoGPT
$0.7
$0.7
7Kilo Gateway
$0.7
$0.8
8OpenRouter
$0.8
$0.8
9NovitaAI
$0.8
$0.8
10DigitalOcean
$0.99
$0.99
Сравнение цен разных API-провайдеров для этой модели.