Passer au contenu principal

DeepSeek R1 Distill Qwen 7B

DeepSeekDeepSeekOpen WeightMIT · Commercial OK

Description

DeepSeek-R1 is the first-generation reasoning model built atop DeepSeek-V3 (671B total parameters, 37B activated per token). It incorporates large-scale reinforcement learning (RL) to enhance its chain-of-thought and reasoning capabilities, delivering strong performance in math, code, and multi-step reasoning tasks.

Date de sortie
2025-01-20
Paramètres
7.6B
Longueur du contexte
Modalités

Radar de capacités

40
general
40
coding
90
reasoning
43
scienceest.
0
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Aucune donnée de classement disponible

Scores de benchmarks (LLM Stats)

Biology

GPQA49.1%Aut.

Code

LiveCodeBench37.6%Aut.

Math

MATH-50092.8%Aut.
AIME 202483.3%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Math
90
Reasoning
70
Biology
50
Chemistry
50
Physics
50
Code
40
General
40

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes