DeepSeek R1 Distill Qwen 7B
DeepSeekDeepSeekOpen WeightMIT · Commercial OK
Description
DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.
Date de sortie
2025-01-20
Paramètres
7.6B
Longueur du contexte
—
Modalités
—
Radar de capacités
40
general
40
coding
90
reasoning
43
scienceest.
0
agents
0
multimodal
Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.
Classements
Aucune donnée de classement disponible
Scores de benchmarks (LLM Stats)
Biology
GPQA
49.1%Aut.
Code
LiveCodeBench
37.6%Aut.
Math
MATH-500
92.8%Aut.
AIME 2024
83.3%Aut.
Indices d'évaluation AA
Aucune donnée d'évaluation AA disponible
Scores par catégorie LLM Stats
Math90
Reasoning70
Biology50
Chemistry50
Physics50
Code40
General40
Tarification
Aucune donnée de prix disponible
Vitesse
Aucune donnée de vitesse disponible
Fournisseurs disponibles
(Unités internes LS)Aucune donnée de fournisseur disponible