DeepSeek R1 Distill Qwen 32B

DeepSeekDeepSeekOpen WeightMIT · Usage Commercial

Description

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Date de sortie

2025-01-20

Paramètres

32.8B

Longueur du contexte

—

Modalités

text

Radar de capacités

general

coding

reasoning

scienceest.

agents

multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine	#Rang	Score	Source
Classement codage	361	21.0	AA
Classement général	336	33.0	AA
Raisonnement mathématique	113	72.0	AA
Science	253	44.0	AA

Scores de benchmarks (LLM Stats)

Biology

GPQA

62.1%Aut.

Code

LiveCodeBench

57.2%Aut.

Math

MATH-500

94.3%Aut.

AIME 2024

83.3%Aut.

Indices d'évaluation AA

Math Index

63.0

Intelligence Index

11.0

Math 500

0.9

Mmlu Pro

0.7

Aime

0.7

Aime 25

0.6

Gpqa

0.6

Scicode

0.4

Livecodebench

0.3

Ifbench

0.2

Lcr

0.1

Hle

0.1

Scores par catégorie LLM Stats

Math

Reasoning

Physics

General

Biology

Chemistry

Code

Tarification

Prix d'entréeGratuit

Prix de sortieGratuit

Prix mixte (3:1)Gratuit

Vitesse

Tokens/sec0.0

Délai du premier token0.00s

Temps de réponse0.00s

Classement des Prix par Fournisseur

8 fournisseurs

Moins cher: SiliconFlow (China)Plus cher: NanoGPT

FournisseurEntréeSortie

1SiliconFlow (China)Moins cher

$0.18

2SiliconFlow

$0.18

3Alibaba (China)

$0.287

$0.861

4Kilo Gateway

$0.29

5NovitaAI

$0.3

6Cloudflare Workers AI

$0.497

$4.881

7Cloudflare AI Gateway

$0.5

$4.88

8NanoGPT

$1.4

Comparer les prix entre différents fournisseurs API pour ce modèle.

Sources externes

LLM Stats Artificial Analysis